不同的人脸之间有着共同的特征,每个人的脸部都有眉毛、眼睛、鼻子、嘴巴、耳朵等器官,器官形状基本相同,且每个器官在面部的相对位置是稳定的,如人的眼睛在头部的1/2处,儿童和老人约在1/3以下;眉毛外角弓到下眼眶,再到鼻翼上缘,三点之间的距离相等,两耳在眉与鼻尖之间平行线内等。
面部特征的个体差异也是客观存在的,世界上根本不存在两张完全相同的人脸,即使是看起来非常相似的双胞胎,在某些方面也存在着不同之处。对于一个特定人而言,眼睛的大小、鼻子的高低、嘴唇的形状以及相互之间的位置等都刻画了这个人的面部特征,而这些面部特征可以被我们定义的人脸特征点所反映。
由于人脸的特征点有限,而人的面部是十分复杂的,要想使用有限的特征点数据直接进行人脸三维重建基本上不太可能,但是可以利用人脸之间的共性与差异来完成三维重建。可以定义一张典型的、不具备任何明显特征的人脸作为一般人脸,使用特定人脸与一般人脸的特征点差异对一般人脸模型进行修改,使其通过变形向特定人脸的真实造型逼近,从而得到特定人脸的三维造型。
一般人脸模型是一般人脸的三维控制网格模型,是对一般人脸的真实测量数据经过数据压缩后得到的有效的控制网格数据。根据前人已有的研究,一个优秀的标准模型应该具备以下几个特点:
1)参数化利用具体人脸的信息,调节参数能够描述出个性特征,从而形成了个性人脸模型。
2)能形象化地、准确地描述人脸的基本形状,并能做一些表情动作。
3)简单化模型顶点越多,描述人脸的精度就越高,但是给模型的拟合和后期处理增加了困难。但是顶点太少又不能精确地描述人脸的细节,因此需要在模型的复杂性和精度之间作一个折中。
20世纪90年代,各研究组纷纷提出了自己的人脸模型,其中普遍应用的是网格模型和统计模型。
1.网格模型
网格模型(Mesh Model)是应用比较广泛的人脸的三维模型。网格模型的一般数学描述是
M={VMFMCM} (8-1)
式中,VM为网格节点集合;FM为组成面片的节点编号集合;CM为节点或面片的属性。根据面片的形状,可以把模型分为三角面片模型和四边形面片模型两种。比较流行的是基于三角面片的网格模型。
网格节点在一些文献中被称为控制点(Control Vertex)、特征点(Feature Vertex)等。它们的分布往往是不均匀的,关键部位(如眼睛、嘴巴、嘴角等处)节点密集一些,平滑部位(如额头、脸颊等处)节点稀疏一些。节点越多,三角形平面越多,表达的头部模型越逼真,但是同时也增加了模型的复杂度,给后期处理添加了困难。在这个方面的研究者努力的方向,是利用最少的节点和三角面片来建立逼真的头部模型。代表性的模型有Decarlp等人的B样条模型、Liu等人的中性人脸模型(Neutral Face Model)[6]和Ahlberg的CAN-DIDE-3模型。
宾夕法尼亚大学的DeCarlo等人利用人体测量学得到的数据结合变分技术(Variation Techniques)建立了网格模型。他们的做法是根据人体测量学知识,在人的头部规定一些能表征特征的特征点,然后利用人脸测量方法测量这些特征点和它们之间的关系。这些测量值包括两点之间的最短距离、切线距离、两点连线与坐标轴的倾角等132个数值。对这些测量数据利用变分技术进行处理,然后用B样条曲面将三维模型表示出来。这种方法能比较逼真地描述个性特征,但是需要复杂的测量工作和被测对象的良好配合。
微软研究院Liu和Zhang等人在艺术家的帮助下,建立了一种中性脸的网格模型。这种模型由194个关键点和360个三角平面组成,并且构建了65个可调向量用于模型的变形。中性脸用向量S0表示为
S0=(vT0,1,…,vT0,n)T (8-2)(www.xing528.com)
式中,v0,i(i=1,2,…,n)为关键点坐标,v0,i=(Xi,Yi,Zi)T。调节向量用Mj来表示,则有
Mj=(δvTj,1,…,δvTj,n)T (8-3)
式中,δvj,i(i=1,2,…,n)为对应关键点的调节坐标δvj,i=(δXi,δYi,δZi)T。则一个新脸就可以用S来表示
通过改变系数Cj可以描述不同的脸型。利用这种模型,根据两幅图像和两个图像序列来模拟特定人脸,取得了较好的效果。此种模型的可调参数较少,可以比较方便地进行模型的变形。
瑞典Linkoping大学的图像编码组(Image Coding Group)多年来一直从事三维建模工作。从Rydfalk1987年公布最初的人脸模型以来,他们的模型版本已经修改了多次。2001年,Ahlberg发布了最新的版本CANDIDE-3。这个版本为了达到与MPEG-4标准的统一,对原有的模型做了改动。此模型包括113个关键点和168个三角面片,控制参数由静态人脸定义参数(Facial Definition Parameters,FDP)和动态人脸动画参数(Facial Animation Parame-ters,FAP)组成。静态参数用来描述不同人脸之间的差异,动态参数用来控制脸部的动作,并且根据动态参数可以进行动作编码,在视频传输方面应用较广。
总之,线框模型的建立比较简单,而且有许多专业的三维造型软件(如Maya、3DSMAX、Lightwave等)可以辅助实现。因此,这种模型为新的算法提供了一种方便的试验平台,而且可以结合插值技术或肌肉模型形成动画。目前许多科研单位在应用这种模型。
2.统计模型
统计模型是指利用统计方法从大量采样样本中找出人脸共性,建立统计意义上的标准人脸模型,比较著名的有形态模型和三维特征脸。
德国学者Blanz和Veter等人于1999年研究出了这种形态模型。模型的基础是一个含有200个青年面部数据信息的三维人脸数据库,三维信息由激光扫描仪获得,包括距离信息和颜色信息。每个头部数据称为一个样本脸(Exemplar Face),每个样本脸包括大约7万个点,然后利用复杂的光流算法建立不同人脸的三维点的关系。假设一个人脸的形状可以用向量F来表示,有
F=(X1,Y1,Z1,…,Xn,Yn,Zn)T (8-5)
式中,Xi、Yi、Zi分别表示三维点的坐标。
对应点的纹理信息可以用向量T来表示,有
T=(R1,G1,B1,…,Rn,Gn,Bn)T (8-6)
式中,Ri、Gi、Bi代表点颜色分量。设有m个样本脸,每个样本脸由一个形状向量和一个纹理向量组成,则形态模型可以由这样的m个样本脸构成。对于一个新的个体,它的形状向量和纹理向量可以分别描述为
通过对系数ai和bi的调节,可以描述不同人脸的三维形状特征和纹理特征。三维特征脸[9]类似于特征脸,对预先构建的三维模型用主成分分析方法降维,获得表征脸部形状的主要分量,利用它们的线性组合表达个性化的人脸模型。建立统计模型通常比较麻烦,需要大量的学习数据,而且三维数据的预处理工程非常复杂,建成后的模型具有统计意义上的合理调节参数,使脸部表情达到合理化。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。