人脸检测技术一直是计算机视觉的热点研究内容之一。由于光线、视角、装饰物及肤色等的影响,都会对分类结果产生重要影响。人脸检测技术在人机交互、公共安全等方面有着极其重要的应用价值。
常用的人脸检测技术主要分为以下三类:
1)基于肤色特征的方法
肤色模型是指在一定色彩空间描述肤色分布规律的数学模型,以YCrCb和改进的YCrCb颜色空间作为肤色模型空间。常用的肤色模型有高斯模型、混合高斯模型、三维投影模型、贝叶斯模型和直方图模型等。这类特征适用于构建快速人脸检测算法,但该方法基于人的肤色颜色空间分布统计,受光照、肤色(如黑人肤色)影响较大,因而其实用价值不高。
2)基于灰度特征方法(www.xing528.com)
该类特征考虑了人脸区别于非人脸的本质的特征,如脸部轮廓特征、直方图特征、模板特征等。通过深入研究,开发了适用于人脸检测的Haar特征、HOG特征、LBP特征、SURF特征。这类特征能较好地区分人脸与非人脸,为人脸检测技术的实际应用提供了有力技术支持。
3)基于统计理论的方法
此类方法将人脸检测任务看作为二分类问题,使用大量的“人脸”与“非人脸”样本做训练、构造分类器。如常用的有主成分分析(PCA,Principal Component Analysis),该方法将人脸图像的统计特征正交化产生正交基,减少特征维度并消除各分量间相关性。其中较大特征值所对应的基称为特征脸(Eigenface),利用这些基的线性组合可以描述表达逼近人脸图像。另外一种是用神经网络(ANN)方法,该方法能减少预处理工作,将人脸的统计特性映射到网络的结构和参数中。特别是LeCun等应用卷积神经网络(CNN)在手写体文字识别方面有了令人瞩目的效果。基于深度卷积网络的人脸检测方法以其超越基于其他特征的准确率和召回率,在最近的几年吸引了众多研究人员的关注。
小米公司使用基于Hard negative mining方法来迭代Faster R-CNN网络,在FDDB测试集上跑出了第一的结果。Faster R-CNN包括两个模块:第一个是RPN(Region Proposal Network)网络,该网络用卷积神经网络产生可能的区域;第二个是Fast R-CNN,用来对RPN产生的区域做分析并进一步确定位置和尺度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。