首页 理论教育 认知心理学:人脸的研究兴趣

认知心理学:人脸的研究兴趣

时间:2023-06-19 理论教育 版权反馈
【摘要】:认知心理学很重视对人脸识别的研究,首先因为人脸识别是我们所知的鉴别人的最常用的方法,而表情识别是人类交往沟通的重要手段,人脸识别及表情识别能力在我们的日常生活中有着至关重要的作用。目前认知心理学对人脸识别的加工过程已有相当多的了解,并且研究者还发现了一种非常具有理论价值的知觉障碍,即面孔失认。目前,大多数面孔识别研究均利用照片或其他二维刺激。认知心理学在研究人脸识别的过程中发现了面孔失认现象。

认知心理学:人脸的研究兴趣

认知心理学很重视对人脸识别的研究,首先因为人脸识别是我们所知的鉴别人的最常用的方法,而表情识别是人类交往沟通的重要手段,人脸识别及表情识别能力在我们的日常生活中有着至关重要的作用。通过人脸认知这种基本而重要的社会行为,人们可以获得许多重要的社会信息(如年龄、性别、种族和情绪等)。从本质上研究人脸认知加工的基本规律和特点不但有助于我们对许多与人脸认知有关的现象(如人脸认知的发展、反转效应、跨种族效应等)进行解释,而且有助于我们对人类一般知觉加工模式规律的认识。其次人脸及表情识别与其他的物体识别在很多方面都有差别。目前认知心理学对人脸识别的加工过程已有相当多的了解,并且研究者还发现了一种非常具有理论价值的知觉障碍,即面孔失认(Prosopagnosia)。在实际应用中,人脸认知的研究可以有效地促进机器人视觉研究的发展,其研究的成果还有助于对人脸有缺陷的病人进行外科整形手术,改善由于脑部受伤而引起的人脸认知失调的病人的认知能力,以及在法律事件中对罪犯的指证等。因此,人脸认知研究有着重要、广泛的研究和应用价值。

Bruce提出了一个人脸识别模型,如图2-20所示。该模型由八大部分组成:

978-7-111-57609-9-Chapter02-20.jpg

图2-20 Bruce的人脸识别模型

(1)结构编码(Structural Encoding)部分 结构编码产生关于面部的表征或描述。结构编码又由两部分组成:一部分是以观察点为中心的描述;另一部分是与表情无关的描述。以观察点为中心的描述将对面部的整体结构和特性进行抽象的描述,其描述结果将送至表情分析和面部语言分析部分作进一步的处理,而那些更加抽象的与表情无关的描述将送到面孔识别单元

(2)表情分析(Expression Analysis)部分 可从面孔特征推测人的情绪状态。

(3)面部语言分析(Facial Speech Analysis)部分 对说话者嘴唇运动的观察可帮助语言知觉,该部分负责处理对嘴与舌可见运动的描述。

(4)直接视觉处理(Directed Visual Processing)部分 特定面孔信息可被选择性地加工。

(5)面孔识别单元(Face Recognition Unit,FRU)部分 这些单元存储着已知人员的面孔结构性信息。

(6)个人身份节点(Person Identity Node,PIN)部分 这些节点可提供关于个体的信息(如职业和兴趣等)。个人身份节点与面孔识别单元的区别在于:面孔识别单元只能对人的面部进行识别,而个人身份节点不但可以识别人的面部,还可以识别人的表情。

(7)姓名产生(Name Generation)部分 产生相应的人名

(8)认知系统(Cognitive System)部分 该系统包含附加信息(如演员往往有更吸引人的长相)。

该模型说明,当看到一个人的面孔时,首先进行结构编码,然后将以观察点为中心的描述传递到表情分析和面部语言分析部分,其中嘴与舌的可见运动描述将送到面部语言分析部分,面部表情的客观描述则送到表情分析部分;将与表情无关的描述送到面孔识别单元。面孔识别单元会将信息输入认知系统,认知系统将根据已存储的面部结构编码与刚输入的面部结构编码进行匹配。表情分析和面部语言分析部分都与认知系统相连,并通过认知系统将信息送入个人身份节点,个人身份节点再根据面孔识别单元和认知系统传入的信息对刚输入的面孔进行识别。个人身份节点的识别结果输出到名字产生部分,产生相应的人名。

对熟悉面孔的识别主要取决于结构编码、面孔识别单元、个人身份识别和姓名产生四个部分,而对于不熟悉面孔的加工过程则主要涉及结构编码、表情分析、面部语言分析和直接视觉处理部分。

Bruce的模型对面孔的各种信息及信息之间的关系给出了统一的解释。该模型的另一个优点是,对熟悉与不熟悉的面孔的加工过程进行了明确的区分。但是,这个模型也存在一些局限性。如这个模型的各部分还需要进一步的细化,各部分之间的关系还需要进一步说明,信息流向也有待进一步研究。另外,模型对认知系统的定义很模糊,对这一部分的细化将会很困难。

978-7-111-57609-9-Chapter02-21.jpg

图2-21 Burton和Bruce的交互激活和竞争模型

后来,Burton和Bruce对模型进行了改进,提出了交互激活和竞争模型,如图2-21所示。这个模型采用了连接主义范式,面孔识别单元(FRU)和姓名识别单元(Name Recognition Unit,NRU)分别包含关于面孔和名字的信息,个人身份节点(PIN)是进入语义信息内容的门户,而且这些节点能被关于人名的言语输入以及面孔输入所激活,语义信息单元(Semantic Informa-tion Unit,SIU)包含名字以及与个体有关的其他信息。(www.xing528.com)

这一模型已经被用来解释从面孔识别中发现的联想启动效应。该模型与Bruce模型的差别是,关于面孔和自传信息的存储问题。在Burton和Bruce的交互激活和竞争模型中,这两类信息均存储在语义信息单元中,而在Bruce的模型中,名字信息只有在自传信息之后被加工。

当识别一副面孔照片时,可以利用两类信息:一是关于个体特征的信息,如眼睛的颜色等,二是关于这些特征的完形或整体安排的信息。很多面孔识别方法都是基于一种特征范式。比如警察经常利用拼图认人法来协助目击证人识别嫌疑人面孔。

据Young、Hellawell、Hay的研究报道,在面孔识别中也要考虑面孔特征的完形方面的信息。他们做了个实验,把许多著名人像的上下半部分重新组合构成一些新的面孔。实验中,当上下两半连接较紧密时,在命名上半部人像时出现明显困难。而当两部分连接不紧密时,成绩则好许多。因此可以假定,两半部分靠紧所产生的新的完形使面孔识别受到了干扰。

目前,大多数面孔识别研究均利用照片或其他二维刺激。因此这种研究存在两方面的局限性。第一,对观察者来说,注视一个实际的三维面孔会比一个二维表征获得更丰富的信息。第二,人类面孔通常使富于变化的、通过面孔表情来反映情绪状态和意见等。这些随时间变化的动态信息都不能在照片中体现出来。

认知心理学在研究人脸识别的过程中发现了面孔失认现象。面孔失认患者表现为丧失对熟悉面孔的识别能力,而对其他对象的识别基本完好。对这种现象有两种解释:一种解释认为是因为对某一特定面孔与另一特定面孔进行区分,比区分其他对象(如椅子和桌子)需要更精细的识别;另一种解释是面孔识别涉及一些其他对象识别不需要的特殊加工机制。

面孔识别涉及特殊机制的观点可以用双重分离现象来证明。双重分离是指一些患者面孔识别正常,而对其他对象的识别存在视觉性失认现象,而另一些患者则正好相反,对非面孔对象的识别正常,对面孔识别存在障碍。如果面孔识别真的涉及一些特定加工机制,那么在某种程度上,应该可以猜想面孔识别和其他对象识别分别与大脑的不同区域有关。Farah和Aguirre于1999年对相关的正电子发射计算机断层扫描(Positro Emission Tomography,PET)和功能性核磁共振成像(funcntional Magnetic Resonance Imaging,fMRI)研究进行了元分析(Meta Analysis),发现许多证据之间是不一致的。然而,Kanwisher、McDermott和Chun在1997年对面孔、拼凑的面孔、房子和手的大脑激活区域进行比较时,获得了非常清楚的关于面孔识别机制的证据。他们在右侧梭状回(Fusiform Gyrus)的某些部分发现了与面孔识别有关的特异性激活,而且其他研究者也已重复了这一现象。

1991年,Farah和McClelland提出了一个基于连接主义网络的计算机模型。该模型对已发现的双重分离详细进行了解释,还对物体识别所牵涉的关键过程给出了一个简洁解释,同时此模型也有助于解释为什么生命体识别障碍患者多于非生命体识别障碍患者。

这个计算机模型有两个外围输入系统和一个语义系统组成,外围输入系统分别是视觉系统和言语系统,当呈现一个视觉目标时,在视觉系统内将会产生一个独特的兴奋模式。当呈现一个目标的名字时,在言语系统内也将会产生一个独特的兴奋模式。两个系统之间并无任何直接连接。Farah和McClelland认为,视觉和言语两个系统通过一个语义系统发生联系,而且目标命名涉及对从视觉系统进入语义系统,再到言语系统的信息的加工过程。

这个计算机模型的关键特征之一是语义系统被分解为视觉单元(Visual Unit)和功能或语义单元(Functional or Semantic Unit)。并且视觉单元的数量是功能单元的3倍,所有语义系统内的单元都是彼此连接的。视觉单元蕴含识别对象的视觉特征信息,功能单元包含关于对象的用途及对象之间相互影响方式的语义信息。至于为什么语义系统内视觉单元是功能单元的3倍,研究者通过实验给出了答案。向被试对象给出生命体和非生命体的词典定义,要求被试对象判断描述是视觉性的还是功能性的。实验结果表明,3倍以上的描述被认为是视觉性的。尤其要指出的是,对于生命体来说,视觉性描述与功能性描述之间的比率是7.7∶1,而非生命体的比率仅是1.4∶1。

当然,这个模型也有一些缺陷。首先,物体识别所涉及的过程肯定要比该模型所描述的复杂得多。模型对语义系统是怎样被巧妙地组合到视觉和功能子系统中的,没有清楚地论述。存在这样的可能:这种组合是基于类别特性的,不同类别的物体分别存储于大脑的不同区域。Damasio等对这种可能情况进行了研究。实验中,首先要求大脑损伤患者对一些著名面孔、动物和工具进行命名,随后把同样的目标命名任务分配给正常人做测试。PET数据显示,大脑左半球的不同区域分别与面孔、动物和工具的识别有关,而且采用不同被试的两组实验,其结果完全一致。Damasio的实验总结中提到“与人类有关的词汇的提取异常,同左侧颞极(Temporal Pole,TP)有关;与动物有关的词汇的提取异常,同左侧颞下区(Infero-temporal Region,IT)有关;与工具有关的词汇的提取异常,同后外侧颞下区(Posterolateral Inferotemporal Region)有关;图2-22所示显示了这些相关大脑区域。当然,可以肯定地说,大脑中还有其他一些区域也参与物体的识别。此外,该模型还存在一个问题。该模型定义语义系统中视觉和知觉单元是彼此连接的,如此一来,对于严重视觉记忆障碍患者,当只提供目标的名字时,其关于功能信息的记忆也应该很差。事实上,一些严重的视觉记忆障碍患者表现出完整的功能记忆。

978-7-111-57609-9-Chapter02-22.jpg

图2-22 脑损伤患者的大脑左半球中,与识别著名面孔、动物和工具有关的脑区

Farah提出的一个物体识别的双加工模型可用来理解面孔识别。该模型对整体和局部加工或分析进行了区分。整体分析是指对某一对象的完形或整体结构进行加工;局部分析是指加工集中于某一对象的关键部分。Farah认为,绝大多数的对象识别都涉及整体分析和具备分析过程。只不过,面孔识别主要依赖于整体分析,而文字识别更依赖于局部分析。Farah通过实验找到了支持面孔识别主要依赖于整体分析这一观点的证据。实验设计如下:先向被试对象呈现一些面孔和房子的素描图,然后要求被试对象把某一名字与面孔和房子一一对应起来。随后,向被试对象呈现整个面孔和房子或只呈现面孔和房子的一个单一特征(如嘴巴、窗户),要求被试对象判断一个给出的特征是否属于某一特定个体(其名字之前已经给出)。实验结果如下:当呈现完整面孔时,对面孔特征的识别成绩要比只呈现单一特征好得多。与之相反的是,对房屋特征的识别在整体和单一特征条件下均很相似。这一结果支持了整体分析对面孔识别的作用要比对非面孔物体识别的作用重要得多的观点。

Farah还通过研究面孔倒置效应得到了支持其模型的进一步证据。在这个效应中,识别面孔的能力在刺激以倒置的方式呈现时会显著下降。Farah通过实验发现,当被试对象为正常人时会出现面孔倒置效应,而面孔失认患者则出现了相反的结果,即面孔倒置促进面孔识别。对这一现象,Farah是这样解释的:面孔倒置效应发生的原因是,正常个体对正常呈现面孔的完形或整体的加工不能轻易地用于倒置面孔的加工。而面孔失认患者运用整体或完形加工的能力十分有限,所以他们不能表现出面孔倒置效应。

总之,Farah等人的研究提供了一些证据来说明面孔识别通常所涉及的加工,在某种程度上与非面孔物体识别和文字识别不同。Farah的双加工模型对上述三类刺激所涉及的加工的异同进行了论述。同上述所有模型一样,双加工模型也不是完美的。Farah的双加工模型只是从相当一般的层面,做出了一个过于简单化的说明。例如,Farah认为面孔是被整体识别的,但有些证据表明,确实在大脑左半球系统是用特征分析的方法识别面孔的。此外,Farah没有区分面孔失认中的知觉性失认和联络性失认,这也引起了一些问题。

综上所述,目前认知心理学对面孔识别的研究已有一些成果。观察者可从面孔获取多种信息,而熟悉面孔和陌生面孔之间也存在重要差别。研究者已经发现了对面孔进行完形加工的证据,但也存在成分加工的证据(特别是加工倒置面孔时)。已有证据表明,面孔失认现象是因为特异性面孔加工机制受损所造成的,而不是精细辨别能力缺乏的原因。而且有证据表明,面孔识别主要涉及整体分析过程,文字识别主要涉及局部分析过程,非面孔物体识别则两者兼有。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈