首页 理论教育 基于形状的人脸检测原理及实现

基于形状的人脸检测原理及实现

时间:2026-01-23 理论教育 小霍霍 版权反馈
【摘要】:相比之下,这种基于器官的分块方法,充分利用了人脸器官的自然分布,规则制订过程中,对先验知识的利用更加直观,并使马赛克子块对脸形的自适应操作成为可能,从而提高了检测效率和鲁棒性。对明显瘦长形脸、扁宽形脸等,则应采用相应的矩形分块策略,以免由于无法形成合理的马赛克覆盖而造成检测漏报。

这里具体介绍马赛克方法(镶嵌图方法)。其基本思路就是将人脸分为若干低分辨率马赛克子块,利用人脸各子块之间的相互关系进行人脸检测。

1.标准分块策略

参考文献[11]提出了一种新的分块方法,即广义的三分图。相比之下,这种基于器官的分块方法,充分利用了人脸器官的自然分布,规则制订过程中,对先验知识的利用更加直观,并使马赛克子块对脸形的自适应操作成为可能,从而提高了检测效率和鲁棒性。

参考文献[11]设计的基于器官的马赛克人脸模型如图5-3所示,子块0对应于左眼区域(包括眼眉部分),子块2对应于右眼区域,子块4对应于鼻子区域,子块7对应于嘴巴,子块(3,6,5,8)对应于两侧脸颊。假定子块(0,3,6)与子块(2,5,8)具有大致相同的宽度,子块(1,4,7)宽度相同,所有的子块高度大致相同。经过子块形状自适应后,上述分割将有些变化,但保持同一行三个子块高度相同,同一列三个子块宽度相同。如前所述,由于脸形的不同,对多数的圆脸和方形脸采用方形的子块分割是合理而有效的。对明显瘦长形脸、扁宽形脸等,则应采用相应的矩形分块策略,以免由于无法形成合理的马赛克覆盖而造成检测漏报。考虑到多数情况下,人脸可能的纵横比在0.8~1.3之间,而马赛克方法对小范围内纵横比的变化不敏感,可简单量化为3~5个量级,但即使如此,运算量也会成比例增加,因此他们采用了块形状的自适应技术来缓和这一矛盾。

图示

图5-3 马赛克人脸模型

a)四分块策略 b)基于器官的分块 c)马赛克分块

2.粗检测

由于块统计量的计算过程比较费时,为尽可能快速地完成检测过程,需要进行高效率的粗检测。粗检测环节包括利用检测环境信息的粗检测和利用人脸器官信息的粗检测两个子过程,后一过程更具有普遍意义。显然,如果能通过某种方法稳定地检测到人脸模型大马赛克块的左上角,则搜索可局限在这个左上角子集合上进行,从而显著减小搜索空间、降低计算量,称这种能被稳定检测的人脸区域上的代表点(区域)为基准点或锚点。理想的锚点应该是在不同表情下位置比较稳定,并且易于检测的点。如眉角、眼角、嘴角等,眼球、鼻孔在某些简单摄像条件下最易于检测,我们的粗检测方法就基于眼球检测。

通过观察发现,在适当的分辨率下,人眼的眼球大致可视为一个白背景上的椭圆形实心黑块(对眼球的反光可通过中值滤波加以抑制),图5-4a、b所示为小眼睛(眯眼)和大眼睛(瞪眼)的情况。这种实心小黑块可用中央凹DoG算子(见图5-5)进行相关检测。粗检测首先形成一个特定尺度下锚点置信度图,图中每个点的值表示该尺度下,该点周边地区与人眼球模型的相似程度。对各尺度下锚点置信度图进行局部阈值二值化,得到粗检测的锚点集合,它将指导候选区域的筛选工作

图示

图5-4 眼球的简化模型

a)小眼睛 b)大眼睛

图示

图5-5 中央凹DoG算子

3.层次化局部搜索方法与块形状自适应

层次化局部搜索是为进一步减小搜索空间、提高计算效率而设计的。若粗检测得到的锚点集合中点数仍比较多时,则应先进行层次化局部搜索过滤筛选,使尽可能少而精的锚点子集送到下一级块形状自适应环节。具体而言,是通过不断引入子块级的局部通用规则知识,使锚点集不断精练。比如在子块的层次,计算以当前锚点集合中每一点为锚点时,相应子块0与子块3的平均梯度差作为该点成为新锚点的置信度水平,从而得到一个新的锚点置信度。对此锚点置信度上进行局部二值化,得到更小的修正锚点子集。对此小子集进行完整的块形状自适应和块统计量计算并运用规则进行人脸检测。(https://www.xing528.com)

人有多种自然脸型,如圆脸、方脸、瓜子脸等。不同脸型下,面部器官分布的差异非常大,采用固定的分块策略(如方形或长方形)很难满足各种脸形情况,为此引入了块尺寸、形状的自适应技术,动态地适应脸形的变化。它分为两个层次:首先对块内马赛克子块划分进行调整;之后进行马赛克大块整体的扩张和收缩。后者主要用于最后的候选区域合并过程,而前者是在每次完整计算子块统计量之前进行。具体操作时,这一环节是在整体分块尺寸大致不变的情况下,按某种经验主义的能量函数对左右两列子块的宽度和上下两行子块的高度进行小范围调整。参考文献[11]给出一个调整子块(2,5,8)宽度的简单能量函数如下式所示:

fx)=Gav[2]-Gav[5] (5-12)它实际上反映的是块2与块5的梯度对比度。在一定范围内,通过使上述梯度对比度能量函数最大化,实现对马赛克子块(2,5,8)的宽度进行局部的调整。同样道理,可实现对马赛克子块(0,3,6)的宽度调整。

完成对脸型的块形状自适应后,就可以完整地计算各种马赛克块统计量,并应用马赛克规则进行人脸图像块的筛选。

4.块统计量的选择和规则制订

人脸灰度图像上包含的信息很多,寻找并采用计算简便、稳定反映各器官马赛克子块区别的统计量,对规则制订的影响非常大。人的人脸认知和检测过程是在丰富知识模型指导下进行的,完全由计算机实现要遇到很多困难。他们采用了基于水平方向梯度强度和梯度方向的区域统计量,因为它们的稳定性和区别性都非常强。

马赛克方法除了前述若干技术(效率与鲁棒性)实现的考虑之外,最终决定检测性能(虚警、漏报联合损失)的是马赛克规则,它是标准人脸模型的量化表现。一方面该模型要有较大的适用范围,即有较好的模型弹性,以降低漏报率;另一方面要尽可能的严格,增强约束力,以降低虚警。马赛克规则的制订,首先要考虑对如下多样性的支持和容许:

1)脸形的影响:对圆脸和方形脸,子块6、8基本在脸的范围之内,对瓜子脸而言,这两个子块将不确定地包括以外的区域,影响规则的制订。

2)器官相对面积的影响:大眼睛小嘴巴与小眼睛大嘴巴、瞪眼发怒与开口大笑的块统计量分布差别很大,头部俯仰对鼻子形状有很大的影响,进而造成块统计量的大范围波动。

3)面部轮廓不稳定性的影响:脸部的上边缘受发型影响很大,两侧的边缘随扭脸角度和背景高亮度的不同而变化,而下颌的边缘由于与颈部相连,通常难于检测。

4)光照的影响:侧光影响灰度分布对称性,并产生阴影边缘,影响马赛克上的梯度分布。暗光导致对比度过低,影响梯度和灰度计算的有效程度。

5)各种眼镜的影响。

基于水平方向梯度强度的普遍性较好的一些规则见表5-1。其中,Di)表示块i的平均梯度。

5-1 一些普遍性比较好的规则

图示

事实上,由于规则库不参与前面图像处理的过程,有很强的独立性,因此可以有针对性地对具体应用环境和图像质量建立专门的规则库;此外,可把更加细致的器官验证规则引入到这一环节,从而提高检测的准确度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈