“鸡尾酒会效应”
日常生活中的人际交流经常发生在嘈杂的多人环境中。当你进入这样的场景时,耳中会迅速的灌入各种交谈声。但是,这些噪声似乎并不会显著的影响你跟朋友间一对一的言语交流。这种现象——选择性的加工目标对象的言语,同时忽略掉其他背景噪声——被称为“鸡尾酒会效应”。
该效应揭示了人类听觉系统中令人惊奇的能力,即我们可以在噪声中谈话。
鸡尾酒会现象是图形-背景现象的听觉版本。这里的"图形"是我们所注意或引起我们注意的声音,"背景"是其他的声音。在嘈杂的室内环境中,比如在鸡尾酒会中,同时存在着许多不同的声源:多个人同时说话的声音、餐具的碰撞声、音乐声以及这些声音经墙壁和室内的物体反射所产生的反射声等。在声波的传递过程中,不同声源所发出的声波之间(不同人说话的声音以及其他物体振动发出的声音)以及直达声和反射声之间会在传播介质(通常是空气)中相叠加而 形成复杂的混合声波。因此,在到达听者外耳道的混合声波中已经不存在独立的与各个声源相对应的声波了。然而,在这种声学环境下,听者却能够在相当的程度上听懂所注意的目标语句。听者是如何从所接收到的混合声波中分离出不同说话人的言语信号进而听懂目标语句的呢?这就是Cherry在1953年所提出的著名的"鸡尾酒会"问题。
鸡尾酒会效应原理
听觉注意原理
这是因为当人的听觉注意集中于某一事物时,意识会将一些无关的声音刺激排除在外,而无意识却在始终监察着外界的刺激,一旦有一些与自己有关的特殊刺激,就能立即引起注意。该效应实际上是听觉系统的一种适应能力。
简单来说,就是我们的大脑对声音都进行了某种程度的判断,然后才决定听或不听。
折叠声学原理
"鸡尾酒会效应"在声学中是指人耳的掩蔽效应。在鸡尾酒会嘈杂的人群中,两人可以顺利交谈,尽管周围噪声很大,但两人耳中听到的是对方的说话声,你们似乎听不到谈话内容以外的各种噪音。因为你们已经把各自的关注重点(这就是注意的选择性)放在谈话主题上了。
掩蔽效应指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。应用此原理,人们发明了mp3等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。在人们欣赏音乐时,如果设备对高频响应得比较好,则会使人感到低频响应不好,反之亦然。
鸡尾酒会效应两种情况
鸡尾酒会现象可在两种情况下出现:当我们将注意力集中在某个声音上,或当我们的听觉器官突然受到某个刺激的时候。
举例来说,当我们和朋友在一个鸡尾酒会或某个喧闹场所谈话时,尽管周边的噪音很大,我们还是可以听到朋友说的内容。同时,在远处突然有人叫自己的名字时,不论现场多么喧闹,我们都会马上注意到,向声音发出的方向望去。又比如,在周围交谈的语言都不是我们的母语时,我们可以注意到较远处以母语说出的话语。我们所注意的声源所发的音量,感觉上会是其他同音量的声源的三倍。将不同的对话用麦克风录下来相比较,就可以发现很大的差别。
鸡尾酒会现象是图形-背景现象的听觉版本。这里的“图形”是我们所注意或引起我们注意的声音,“背景”是其他的声音。
鸡尾酒会效应对爱情的指导意义
事不关己,高高挂起,但一旦跟自己有关,马上就敏感起来,这对客观地分析爱情是不利的。爱情中,应客观分析过程,对事关自己的东西不要过分敏感进而做出错误判断。
我们都知道,作为物理的波动,各种声音信号是重叠在一起的。将重叠在一起的声音信号分离开来并不像表面看起来那样容易。虽然近年来人工智能(AI)技术迅速发展,但是目前尚无法实现语音的有效分离。令人惊奇的是,人脑似乎可以较为有效的解决“鸡尾酒会问题”。那么,人脑是如何做到的呢?在长达半个多世纪的时间里,来自各个领域的研究者对“鸡尾酒会问题”进行了大量的研究。但是迄今为止,人们仍然无法解释“鸡尾酒会效应”的神经机制。这一问题的关键是人脑如何对混叠在一起的、来源不同的信息进行选择性加工。6月19日,Nature Communications杂志在线发表了北京师范大学认知神经科学与学习国家重点实验室卢春明课题组的研究论文Neural mechanisms for selectively tuning in to the target speaker in a naturalistic noisy situation。该研究利用基于功能性近红外光谱成像(fNIRS)的多人同时脑成像技术(hyperscannig),在相对自然的人际交流情境下对这一问题进行了回答。与以往研究不同,该研究充分发挥了fNIRS技术灵活、便携等特点,并利用了多人同时脑成像技术在研究自然情境下人际互动问题时的独特优势,创设了较为自然的多人对话情境。在实验过程中,两个说话者同时对着倾听者讲话,但是倾听者只选择其中一人作为注意对象,同时忽略另一个人。研究实时记录了三人的脑活动,并计算了倾听者与说话者的脑活动信号随着时间发生共同变化的趋势,即脑活动同步。结果发现,倾听者与其所选择的注意对象之间出现显著的脑间同步(brain-to-brain synchronization),其同步强度显著高于倾听者与非注意对象间的脑活动同步强度。并且,该结果只出现在噪声情境中,在没有噪声的双人交流情境中却没有出现。虽然以往研究发现人脑的神经振荡与言语信号在时间维度上出现选择性耦合,但是由于言语信号与说话者自身的神经振荡也存在密切关系,因此,人际间的脑活动同步可能是解决“鸡尾酒会问题”的重要机制。本研究的发现为这一假设提供了关键的支持性证据。
该同步出现在倾听者和说话者左脑的颞顶联合区(temporal–parietal junction, TPJ)。为了检验该脑区的脑活动同步是与交流内容有关,还是与声音的物理特征或发音动作有关,该研究进行了一系列的深入分析。结果发现,倾听者与选择对象间的脑活动同步在双方出现话轮转换前大约4-5秒左右达到峰值,并与交流质量有显著相关。特别是,当倾听者的脑活动领先于说话者的脑活动1-3秒时,脑间同步达到最强。这些结果表明,倾听者可能通过提前预测说话者的言语内容来调节互动的节律,从而实现对言语的选择性加工。因此,交流内容,而不仅仅是感觉运动信息,在“鸡尾酒会效应”中可能发挥着重要的作用。
该项研究与卢春明课题组的其他工作一脉相承。近年来,课题组采用最新的多人同时脑成像技术,深入探讨了自然情境下人际交流的认知神经机制。课题组此前的研究发现,在自然的交流环境中,面对面交流比背对背交流出现更强的脑活动同步(Jiang et al., 2012)。本研究则将脑活动同步在人际交流中的作用拓展到了噪声背景下。卢春明课题组的系列工作还探讨了人际间脑活动同步在社会关系形成和发展过程中的重要作用。研究发现,在交流过程中自发产生的领导者与追随者产生更强的脑间同步(Jiang et al., 2015);老师通过脑活动同步对学生知识掌握程度的预测越准确,对教学效果的促进作用就越显著(Zheng et al., 2018)。课题组的其他相关研究工作也在一一展开。
该项研究的第一作者代博涵于2011-2014年在北京师范大学认知神经科学与学习国家重点实验室跟随卢春明教授攻读硕士学位(本研究是代博涵硕士期间的工作)。此后,代博涵赴荷兰马普心理语言学研究所及荷兰唐德斯脑、认知与行为研究所攻读博士学位(导师为美国科学院外籍院士、著名心理语言学家和神经科学家Peter Hagoort教授)。代博涵目前的工作主要采用脑磁图(MEG)技术探索大脑如何分离和编码噪声环境中的语音信息(Dai et al., 2017; Dai et al., submitted)。
该项研究是卢春明课题组与加州大学尔湾分校的陈传升教授以及重点实验室语言认知与障碍研究团队的同事共同完成。