1.人脸面部形态
人脸的形状,包括特征器官的形状、位置、分布,是相对不变的,虽然人脸各部分没有绝对标准,并在一定范围内变化,但它们之间有一定的比例关系。通常所说的“三庭五眼”是指发际线到眉毛、眉毛到鼻孔、鼻孔到下巴的距离各是脸长的三分之一,脸宽是五个眼睛的长度之和。其中,右外耳孔至右眼外角之长=右眼长=眼间距离=左眼长=左眼外角至左外耳孔。另外的知识包括:眼球四周较亮,中间是一个较暗的圆形,左、右眼对称,左、右鼻孔对称,这些先验知识都能给检测定位提供依据。
面部形态一般可按照如下的形态分类。
(1)面形 面形大致可分为椭圆形、卵圆形、方形、棱形等。
(2)眼睛 对眼睛的度量可分为以下几种:
1)有或无内眦皱裂;
2)眼裂高度狭窄、中等或较宽;
3)眼裂宽度有长有短;
4)眼裂倾斜度水平或内外不等。
(3)鼻子 对鼻子的度量可分为以下几种:
1)鼻根的高度低平或较高;
2)鼻梁分为凹形、直形和凸形;
3)鼻根点凹陷度不等;
4)鼻翼宽度有狭窄、中等、宽阔几种。
(4)嘴唇 度量嘴唇的量主要有上唇高度、唇的厚度以及口裂宽度。
2.人脸识别中的视觉特征
视觉是一种复杂的信息处理任务,它的研究涉及计算机技术和心理/神经生物科学,早期的理论框架由D.Marr于20世纪80年代初期提出,他把视觉信息处理划分为三个不同层次来描述:①计算理论;②算法;③实现机制。(www.xing528.com)
近几年的研究表明,人类视觉数据处理是多层次的过程,其中最低层次的视觉过程起信息转储作用,即将大量的图像数据转换为抽象的信息,这一任务由视网膜中的两类细胞完成:低层次的细胞对空间的响应与小波变换类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应,这表明在视觉处理过程中,神经元并不是随便地不可靠地把视觉图像的光照强度转手投射到感觉中枢,可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个使人感兴趣的层次结构,人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处:
1)针对人脸识别,大脑中存在一个专门的处理过程。经过长期的研究[9,10],人们发现大脑对人脸的形状有着特殊的兴趣。
2)不同的局部特征作用对识别的贡献也不同。研究也表明,头发、人脸轮廓、眼睛以及嘴巴对识别和记忆有着重要的影响,鼻子的作用则不是很重要,通常来讲,人脸的上部比下部对识别作用更大些。
3)不同空间频率上信息的作用不同,低频信息代表了整体的描述,高频信息包含了局部的细节。对于性别的判断,仅利用低频信息就足够了,对身份识别没有高频信息就无法完成。
4)光照对视觉的影响。有实验表明,从人脸底部打光会导致识别困难。
5)动态信息比静态信息更利于识别,研究还发现,对熟悉的人脸,人类的识别能力在动态场景中更高于静态场景。
6)面部表情的分析与人脸识别并行处理。通过对脑部受损的病人研究表明[12],表情的分析与识别虽有联系,但总体来说是分开处理的。
3.人脸识别中的光照问题
光照变化是影响人脸识别性能的最关键因素。对该问题的解决程度关系着人脸识别实用化进程的成败。我们将在对其进行系统分析的基础上,考虑对其进行量化研究的可能性,其中包括对光照强度和方向的量化、对人脸反射属性的量化、面部阴影和照度分析等。在此基础上,考虑建立描述这些因素的数学模型,以便利用这些光照模型,在人脸图像预处理或者归一化阶段尽可能地补偿乃至消除其对识别性能的影响。重点研究如何在从人脸图像中将固有的人脸属性(反射率属性、三维表面形状属性)和光源、遮挡及高光等非人脸固有属性分离开来。基于统计视觉模型的反射率属性估计、三维表面形状估计、光照模式估计,以及任意光照图像生成算法是主要研究内容。具体考虑两种不同的解决思路:
1)利用光照模式参数空间估计光照模式,然后进行针对性的光照补偿,以便消除非均匀正面光照造成的阴影、高光等影响。
2)基于光照子空间模型的任意光照图像生成算法,用于生成多个不同光照条件的训练样本,然后利用具有良好的学习能力的人脸识别算法,如子空间法、SVM等方法进行识别。
4.人脸识别中的姿态问题研究
姿态问题涉及头部在三维垂直坐标系中绕三个轴旋转造成的面部变化,其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失,使得姿态问题成为人脸识别的一个技术难题。解决姿态问题有三种思路:
第一种思路是,学习并记忆多种姿态特征,这对于多姿态人脸数据可以容易获取的情况比较实用,其优点是算法与正面人脸识别统一,不需要额外的技术支持,其缺点是存储需求量大、姿态泛化能力不能确定、不能用于基于单张照片的人脸识别算法中等。
第二种思路是,基于单张视图生成多角度视图,可以在只能获取用户单张照片的情况下,合成该用户的多个学习样本,可以解决训练样本较少的情况下的多姿态人脸识别问题,从而改善识别性能。
第三种思路是,基于姿态不变特征的方法,即寻求那些不随姿态的变化而变化的特征。我们的思路是采用基于统计的视觉模型,将输入姿态图像校正为正面图像,从而可以在统一的姿态空间内作特征的提取和匹配。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。