人类认知之路(一):Magical Number 7

1955年,心理学家George A. Miller发表了一篇著名的论文The Magical Number Seven, Plus or Minus Two Some Limits on Our Capacity for Processing Information(魔法数字7,加或减2:人类信息处理能力的局限)。

按现在的观点来看,这篇论文简直就是神棍作品,全文没有什么公式,只描述了几个简单的定量实验,连图都没几张,基本上就是作者本人在跟你唠嗑,一边介绍他的理论,一边问你:你想想看,是不是这个道理?

固然,我们也应该正确地认识当时的心理学发展水平,那是行为主义的全盛时代,正是斯金纳们的天下,当其他人类认知相关领域(信息论,计算机和语言学等)都在经历数学理论的突破之时,心理学家们刚刚走出上一个真正的神棍时代(精神分析),还在乐此不疲地对老鼠进行正强化和负强化。

George A. Miller打破了行为主义的统治,
将认知心理学带入了新的时代

这当然不是说Miller的成果虚有其名,《Magic Number 7±2》作为心理学和认知科学领域被引最多的论文,它凭借惊人的直觉,揭示了一个非常浅显而又重要的道理:人类大脑能够同时处理的每种单维信息量非常有限,而当信息超载发生时,出错的概率大的惊人。

Miller提出的第一个简单的例子就是区分音调。测试者为受试者播放不同频率,不同响度的声音,受试者需要进行判断,并给出听到的不同种类声音的数目。实验结果显示,当输入2到3种声音时,受试者几乎从不犯错,输入4种时,犯错也非常罕见,但当超过5种以上的输入时,错误就很常见了,最高到14种输入时,受试者出现了认知意义上的紊乱状态。

Miller由此揭示了人类短时记忆在区分音调方面的限制,也就是我们大脑的音调“寄存器”只能同时储存2.5bits左右的信息。毫无疑问,Miller一定受到了Shannon的信息论的影响,但他所定义的bit,并不是绝对的信息量,而是信息通道或所谓信息“寄存器”的容量,即人类大脑同时能够对一种维度下(例如音调,或音高)不同的信息进行编码(encode)的能力。根据一个简单的二进制换算,1bit 是两种,2 bits是4种,而2.5 bits 则大约是6种。

为了进一步证明自己的理论,他提出了另一种实验方式:如果一个人可以在单次实验中同时分别区分5种高音和5种低音,并不代表他能在同一次实验中区分这10中音调。非常神棍但也在意料之中的是,他并未实际地给出了这个实验的数据,而是和读者打了个赌,你肯定做不到。

“For example, if you can discriminate five high-pitched tones in one series and five low-pitched tones in another series, it is reasonable to expect that you could combine all ten into a single series and still tell them all apart without error. 

When you try it, however, it does not work. The channel capacity for pitch seems to be about six and that is the best you can do.

而响度的实验也证明了Miller猜想的正确性,受试者的平均水平是2.3 bits,大约能够区分出五种不同响度的声音。为了避免质疑者抬杠,他还引用了一个吃盐的实验,也就是吃NaCl,看受试者能不能判断出有多少种咸度的盐水。人类的味觉信息通道似乎比较弱,受试者的平均水平只有1.9 bits,也就是最多区分4种。

有弱必然也有强。人类作为灵长类中对空间和颜色感知最强的物种之一,在视觉的通道测试中表现出色,达到了3.25 bits的水平,在一些设计的更简单的单维度视觉实验中,受试者甚至能够同时区分出15种的位置信息,达到了3.9 bits的水平。

总之,对单维信息的处理能力在一个非常有限的范围内,根据不同的统计方法,可以大致分布在6.5左右,标准差范围4~10,不同维度的能力分布在3~15之间,这就是Magical Number 7的来源。

在此之后,Miller用一个章节继续讲述了多维的实验结果,这些实验类似于之前的单维度实验,但也给出了另一个重要的结论:不同维度的认知通道似乎是共用的,而选择更好的编码方式,能够帮助我们更好的处理信息,有效地利用信息通道的上限,来提高我们的短期记忆能力。(我们将会在以后的文章里再回到这个重要的结论,揭示它如何间接了影响了计算机硬件设计和人工智能的发展。

一个比较简单的例子就是同时区分不同响度和不同声调的声音,在之前的实验中,受试者的平均能力分别是2.3 bits和2.5 bits。测试结果显示两种认知能力并不是简单的相加,最终区分度只达到了3.1 bits。而更复杂的理论则来自于于人类语言,因为人类语言的信息量似乎超出了Magical Number的限制,超过了人脑寄存器的上限。而Miller 则认为,语言交流的编码方式发生了改变,我们不能把每一个音当做占据单个通道的实体,通过人类先天(基于乔姆斯基理论)和后天的约定俗成的编码方式,我们在说话交流的时候,是在用信息块(chunk)的方式占据信息通道传递信息,这种优化的信息编码方式,有效地提升了信息的传输能力。

4个数字一组的Key暗示了人类短时记忆数字的能力
时至今日,任何形式的验证码几乎都不超过6个数字

Magical Number 7的核心理论就在于编码过程的优化可以有效地提升信息通道的效率,以及降低解码过程的信息损失,这一朴素而又天才的论断,至今仍在影响着人类的学习方式,并在交互设计领域,产生了巨大的影响力。

Miller全篇奇思妙想的背后也充满了逻辑和实验数据的支持,这是一个大胆而又完备的猜想。但遗憾的是,由Magical Number开创的认知科学新时代,才刚开始就要结束了。

留下评论