在初步体会到整体和局部识别之后,我想再举一个有趣的例子,方便大家理解这两种识别方法的区别。我们假设这两种相似的环境,第一个是忘记了戴眼镜的上午,第二个是在漫天大雾中,而共同的目标都是寻找一个特别的人。这两种情况有个共性,那就是除了鼻子,我们伸手肯定看不清楚五指。在这么恶劣的环境下,对面的行人可能看起来像下图一般模糊不清。
不过根据我们的经验,这样的情况下我们还是能够分辨熟悉的朋友,找到熟悉的快递员。也就是说我们在模糊的情况下还是可以辨别他人的身份。按道理,不借助语言,单纯从视觉角度分析,我们完全可以识别他人的身份。这样巧妙的过程完全可以借用大脑对面孔识别的过程进行。大雾虽然有毒,但是并不会影响我们的识别能力,所以说我们并没有利用所谓的“模糊情况处理热线”。同时,大雾或者不戴眼镜并不会直接遮盖面孔,所以我们在识别模糊的面孔时并不是完全利用用于识别被遮盖的面孔的方法。
可能你不能认出图片中的这张面孔,但是我的朋友们都能够判断出这张面孔属于我本人。为什么模糊的面孔还能判断身份呢?这就要说一说空间频率了
不谈大雾和摘下眼镜的光学原理。从主观感受方面,我们看不清楚近处的东西,也就是说能见度下降了。那么在这个情况下,我们眼前所有的东西都会变得朦胧,近点的东西相对还好,远处的东西基本就是一片色块。这种“模糊”对于面孔识别究竟有什么影响呢?从经验角度,我们可以发现,似乎人脸的轮廓还能看清楚,但是细节难以辨析。举个例子,在雾里面,我们能大致判断出眼睛在鼻子上面,来者是正常人类不是外星生物,但是我们很难分辨对面的姑娘今天眼线画好了还是疵了。是为什么呢?下面我从识别视觉信息的角度大致解释一下。
大脑对视觉信息的处理非常有趣:简直是信号论的完美实用范例。在我们人脑最后端,一个叫作枕叶(temporal lobe)的区域有一处专门涉及视觉分析的部分。在枕叶最后面有一个区域叫作初级视觉皮层,它正是枕叶皮层上最先开始处理视觉信息的神经区域。初级视觉皮层完全接受了视网膜收集到的信息,不过我们的大脑并不是一股脑儿将信息分析。初级视觉皮层上有上千万的细胞有着各自的个性,不同的感受也让它们只对少数的刺激类型有兴趣,可以说相当专一。正因为不同的细胞对不同种类的信息有着不一样的活跃,不少细胞只对特定类型信息有反应。不知道是有意还是无意,我们的初级视觉皮层悄悄地对视觉信息进行了一次傅里叶转换。这样的转换把图像按照空间频率进行了划分,这种划分恰恰是基础的视觉识别过程中被我们的神经系统采用的。说起来也有趣,我在学习傅里叶转换的时候花了不少时间,不过没想到大脑早就熟练地运用了相同的技巧。在被傅里叶转换之后,一张被看到的面孔按照刺激物的空间频率被划分成了不同的层次。不过不用担心我们的世界在我们心里会支离破碎。在枕叶的视觉皮层上,视觉信息的确按照空间频率被区分开,但是在较高级的视觉皮层,比如说梭状回面孔区,会被整合(binding)成合理的样子。我们可以用电脑大致模拟一下这个过程。
上图是原始图片,而下面三张图是基于这张图片的不同空间频率的组成成分。从左到右空间频率依次上升,图片更加锐利,边缘细节更加清晰。我们的枕叶无时无刻不进行如此的分析
空间频率在科学上指在一定单位长度上,某种几何形状出现的次数(正弦调制的栅条)。这么抽象的概念不是每个人都能一下子理解,用好理解的话说就是,空间评论类似于(但不完全是)图片分辨率:低频率的信息就类似低分辨率的照片,有点复古的像素风格,提供大空间尺度的信息,反映了粗糙的颜色和阴影,不过看起来模模糊糊,有点无法分辨什么是什么;而高空间频率信息正好相反,可以理解为一组地图上精细的等高线,它们最大程度上表现了小范围的光线变化,但是忽略了其中的具体内容,比如颜色还有阴影。一般而言,在一张图片上高空间频率出现在形状变化巨大的地方,比如图片的边界之处,比如发际线、眼袋,甚至法令纹;可以说高空间频率信息可以更有助于我们判断皱纹,从而了解对方的年纪。一般而言,我们判断地方、场景甚至文字都依赖于高空间频率信息,比如说你正在读的这行字基本都是高空间频率的;你想一想摘了眼镜且离远了什么字都看不清楚。但是面孔独一无二,它深深地依靠着两种空间频率的信息,甚至说可以完全依靠低空间频率进行传播。(www.xing528.com)
低空间频率信息相对而言能够提供整体的相互关系。也就是说可以帮助我们判断对方的情绪以及健康情况。高频信息看起来比较细腻,而低频的往往感觉糊成一片;从数学角度你也可以直观地了解两个频率的差异:你可以数一数,一张高空间频率的图片上有8到16对亮度对比强烈的条纹,而低空间频率的图片也就2到8对。空间频率甚至和关注点也有关系,如果面孔正好在我们的注视之下。但是这个对于面孔识别有什么关系呢?对啦,大雾甚至说近视都能够严重削弱高空间频率(HSF)信息,但是不太影响低空间频率(LSF)信息,也就是说这个雾正是一种低空间频率信息过滤器,高空间频率信息难逃厄运,不过低空间频率信息依然畅通无阻。比如说,在光线良好的时候我们一眼就能分清楚动物园里的斑马,但是一旦模糊,大雾降临,斑马看起来就像灰马。难怪在大雾之中,我们对低空间频率信息还能识别,对高空间频率信息的识别只能举手投降。但是这个和面孔识别又有什么关系呢?
同样的斑马,在模糊之后(比如大雾或者摘下眼镜)不光看不清楚,甚至空间分辨率都会被影响,连条纹都难以被数清楚。不信你数数看,右图有多少道条纹
让我们回想下上一节的内容,整体识别正是面孔识别的关键,它的处理其实非常依赖构型信息,或者近似说是整体信息;也就是说,我们识别一个人是谁并不是依赖于面孔某些特殊的形状,而是将它们整合起来。聪明的读者肯定已经发现这部分结论和前面“撒切尔效应”的关系。严格说来高和低空间频率都能给大脑提供分析构型效应的信息:低空间频率信息比较粗糙,通过外侧膝状体的M细胞配合皮质下通道传递,处理与加工速度快,可以说是“速写画”;高空间频率更为细腻,通过外侧膝状体的P细胞配合皮层通道处理,需要更长时间传递和加工,算作“工笔画”。这两个通道和信息类型正是我们进化的一个写照:高速加工一般而言比较古老,比较快却粗糙;低速加工出现更晚,不过细腻且准确。在面孔身份方面(“他是谁?”),我们的大脑也巧用了两个通道的两种层次信息。梭状回面孔区这样一个处理面孔身份的重要区域,不少科学家就发现它对高、低空间频率信息来者不拒,但是分开处理。正因为高、低空间频率信息只是在这儿处理,我们可以说正是梭状回面孔区将不同空间频率信息进行整合(前端处理低空间频率信息,后端处理高空间频率信息),进而汇聚出我们对于面孔的整体识别。作为对比,我们识别文字的文字识别区与梭状回面孔区在位置上几近左右对称,但是这个针对文字的脑区只喜欢高空间频率信息。相比而言,我们判断面孔比判断文字时,神经系统对于信息宽容度高,我们在判断面孔时更方便、更老练。能有如此“博爱”的梭状回面孔区来判断面孔真是幸福而且方便。
在判别他人面孔的时候,二阶关系信息(比如眼睛间距离)和整体信息(所有信息整合为一体而不再估计每一处的局部信息)为面孔识别提供了方便。面孔整体识别更着重于依靠低空间频率信息而不是高空间频率信息,举一个例子,当我们在判断别人身份的时候,梭状回面孔区会对低空间频率信息反应更加活跃。当然两种空间频率信息都对面孔识别提供了线索,但是也有先后关系。虽然完整的识别也不能少了高空间频率信息,但是我们所讲的低空间频率信息恰巧是整体识别必不可少的重要材料,更不要提低空间频率信息相较高空间频率信息更容易传递和处理。不过真实生活中当我们判断“他是谁”的时候,还是LSF更占主导而且重要,就如同前面几节提到的整体识别比局部识别更加重要。比如说在先天性面孔失认症的群体中,他们有着相对完善的情绪识别能力,但是没有完善的身份识别能力,研究人员发现他们的梭状回面孔区有着缺陷(具体是活跃性还是连接程度有待进一步研究),这一缺陷导致了身份识别障碍。但是这个障碍源于这群人没办法合理地分析低空间频率信息,所以巧妇难为无米之炊,没有LSF信息,面孔识别就如同正常人看到倒置的面孔一样抓瞎了。换句话说,只要有低空间频率信息被我们捕获,我们就能整体识别这张面孔;只要这部分信息足够,我们也就能够判断出这个人是什么情绪,他到底是谁。
虽然模糊的面孔让人捉摸不透,但与身份识别息息相关的低空间频率信息并没有被太多影响,所以对于普通人,我们依然能够针对所拥有的信息进行身份识别。当然,高空间频率信息也能帮助我们识别他人,很明显戴上眼镜识别更方便;不过相对而言,整体识别才是面孔识别的大梁,大梁的基础,低空间频率信息很重要呢。当然高空间频率的信息也能够提供一定的整体信息,帮助大家识别面孔,不过重要程度上还是差一点。最后告诉大家一个小贴士,因为大脑结构的原理,我们梭状回面孔区针对高空间频率信息这样一种细节丰富可以提高判断正确率的信息有着一定要求,具体而言就是面孔处在我们视野中心(视野中心也就是正对着视网膜中心凹)时其高空间频率信息可以被最优化处理;言外之意也就是想要看别人看得更清楚,还是得正眼看人,正因为高、低空间频率信息只是在这儿处理,我们可以说正是梭状回面孔区将不同空间频率信息进行整合(前端处理低空间频率信息,后端处理高空间频率信息),进而汇聚出我们对于面孔的整体识别。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。