人脸是日常生活中人们最为熟知的对象之一,相对于一般绘制对象,人脸具有如下重要特性:
(1)生理结构复杂 面部的生理结构十分复杂,包括表皮、肌肉、骨骼三层,基本形状由最内层的骨骼决定,肌肉末端附着于骨骼上,肌肉和表皮间由韧带相连。整个头部骨骼通常称为头颅,由楔状骨、上颚骨、次鼻骨、颊骨、颧骨、眼眶骨、鼻犁骨、眉骨、颅骨、下颚骨、筛骨组成。肌肉的缩张驱动表皮组织产生运动,导致面部表现形式的变化,所有面部肌肉运动综合作用就产生了丰富多彩的表情。上述生理解剖学的原理是人脸建模的基础和依据。
(2)形态内容丰富 心理学研究表明,人脸能够产生大约55000种不同的表情,其中有多种能够用人类自然语言词汇区别开来。
(3)结构、表情上共性明确 所有人的面部结构和表情变化都有着明确的相似性。生理结构上都由口、眼、鼻、耳、眉等五官组成,头颅结构也完全相似;表情表达上,所有人脸都存在着共性,甚至动态的变化过程也十分相似。
(4)个性因素繁多 人脸存在共性的同时,又有着千差万别的个性。例如,人眼睛虹膜近乎相同的概率是百万分之一,人耳朵形状的差别更大。不同的人种具有不同的肤色、五官特征。表情的细节也各有特点,没有两个人的笑容完全相同。
(5)易受环境影响 摄取的人物的图像、视频随着周围光照环境的不同,差别很大;因为面部的形状不是严格的凸结构,所以有时会出现光照上的遮挡;人们有时会佩戴眼镜。这些都会给计算机处理带来很大困难。
下面分别从人脸识别、表情识别和人脸合成三个方面来具体介绍人脸工程学研究在实用化过程中的挑战。
1.人脸识别的难点
目前人脸识别的难点主要存在于以下几个方面:
1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。
2)成像角度及成像距离等因素的影响,即人脸的姿态变化,会使垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。
3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。
4)采集人脸图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类别间人脸图像的识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。
5)人脸的图像数据量巨大。目前出于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64×64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量很大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运动等有用信息的。如果要使用全部的有用信息,计算量就更大了。
另外,人脸识别还涉及图像处理、计算机视觉、模式识别以及神经网络等学科,也和人脸的认识程度紧密相关。这些因素使得人脸识别成为一项极富挑战性的课题。
2.表情识别的难点(www.xing528.com)
人类用肉眼识别人脸信息时几乎没有什么困难,但对计算机视觉系统来说则非常不容易。用计算机来分析识别面部表情是一个非常复杂的、极富挑战性的问题,它的挑战表现在:
1)人脸是一个塑性变形体而不是刚体,难以对人脸表情进行建模。
2)表情对应于人脸部骨骼和肌肉的运动,其表现是细微多变的,可以缓和也可以激动,所以非常复杂。
3)光照对于人脸图像的影响也很大,同一个人的同一个表情图像,如果光照不同,可能得到完全错误的分类结果。
4)表情识别课题研究涉及多学科的发展,比如图像处理、计算机视觉、模式识别、应用心理学、生命科学、认知科学等,而其中的大部分学科都是刚刚兴起,处于探索阶段,理论和方法仍有待完善;现有的经典的图像处理技术的局限性也是一个不容忽视的问题。
此外,没有统一的表情库,也使得难于对各种识别方法进行比较和判断。目前可供研究的数据中,数据库表情带有很强的人为色彩,而现实生活中人们的表情可能并不夸张,因而实验室中采用的方法将难以应用到实际生活中。
3.人脸合成的难点
在计算机技术飞速发展的今天,用计算机便捷、逼真地模拟人脸的造型及其运动仍然面临着巨大挑战,这主要有几个方面的原因:
(1)人脸生理结构复杂 人脸面部由表皮、肌肉和骨骼三层结构构成,其基本形状由内层的骨骼决定,肌肉末端附着于骨骼上,表皮与肌肉紧密相连。面部的长相由骨骼和肌肉共同决定,面部的表情变化是骨骼、肌肉以及表皮和皮下层的物理运动综合作用的结果。另外,表皮的颜色和纹理的细微变化都会影响人脸的视觉效果。
(2)人脸的几何结构复杂 人脸不但生理结构复杂,几何结构也很复杂,而且人与人之间的几何结构均不相同。人的头发、嘴巴、耳朵、眼睛的几何结构很难用一个恰当的模型来表示,其几何数据也很难获得,人脸运动时的几何结构变化则更难模拟。人脸的运动包括刚性的人脸姿态变化和非刚性的人脸器官和肌肉运动,这些由人脸的皮下肌肉和人脸皮肤的动力学特性决定的运动很难用模型来表示。
(3)人脸表情丰富 人们通常把人脸大致分成六种表情:高兴、生气、害怕、惊奇、难过和厌恶。而且人的心境往往同时包含多种情绪,因此实际的表情就更要复杂得多。
(4)个性因素 人脸在具有相同的拓扑关系的同时,具有非常明显的个性因素,如种族、形状、颜色以及纹理的不同。除了外观差异外,表情动作的细节也是千差万别。
(5)光照的影响 人脸的皮肤存在着皮下散射和折射,眼睛的光照特性很难获得,人脸的复杂几何以及皱纹、眉毛和脸部细毛使人脸的光照特性非常复杂。目前还没有较好的方法来直接测量人脸的光照特性。
对于基于图像的方法而言,建立一个性能优良的图像库存在较大难度。一方面,为了使得系统能够合成尽可能多的表情和姿态,应该使图像库包含尽可能多的图像样本。但是由于图像本身具有较大的数据量,因此大量的图像的存储需要消耗很多的资源,而且在合成阶段,过多的图像样本会对搜索速度带来负面影响,从而难以达到实时要求:另一方面,图像库中的样本过少,又使得合成备选单元的数量不足,影响最终的合成质量。怎样使数据库在数量和质量之间取得某种折中是一个难题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。