首页 理论教育 MDSSD模型准确率提高20.9%

MDSSD模型准确率提高20.9%

时间:2023-11-23 理论教育 版权反馈
【摘要】:实验结果表明,MDSSD 人脸检测模型的检测准确率较SSD 提高了20.9%,但仍可以达到实时检测的要求。本书只针对模型的改进效果进行对比,因此其Backbone 替换文章不予讨论。具体剖析了以Fisher 准则为基础的LDA 方法在获取人脸特征时存在的一些问题,而且给出了处理方式,同时提出了本书研究的PSO-LDA 算法。研究发现,借助粒子群优化LDA 的方式,识别结果优于或近似于其他算法;在鲁棒性分析中,LDA 方法本身对噪声的抵抗力比较好,再加

MDSSD模型准确率提高20.9%

1. 近十年来,随着计算机计算能力的提高,深度学习再次兴起并得到快速发展,而基于深度学习的算法不断刷新各种计算机视觉挑战赛的各项任务的评分,同时这些模型越来越深,且有持续加深的趋势。同样,人脸检测挑战赛的评分也越来越高,各种SOTA 模型也越来越深,但是人脸检测效果大幅度提升的代价是大量计算资源的消耗,这也就意味着模型在实际应用中的推理速度很慢,因此,其实际工业应用价值很小,但是我们并不能否定这些研究的价值。本书基于实际应用场景的要求,对算法的原理进行分析,并结合具体的检测任务,在通用目标算法SSD 的基础上做进一步改进,提出了可以进行实时检测的高准确率人脸检测算法MDSSD。它在WiderFace 数据集上检测速度为25FPS,准确率81.3%,可以达到工业应用的要求。本书主要完成了如下工作:

(1)首先介绍了人脸检测技术的发展历程以及实际人脸检测任务中的诸多难点,同时介绍了改进这些难点所需技术的基础内容。其次,介绍了较早期的具有代表性的人脸检测算法,并进一步分析了这些算法的优缺点。

(2)针对以上算法的缺陷,本书选用目前综合性能最好的通用目标检测算法SSD,并针对具体的人脸检测任务为SSD 算法进行配置,同时使用 WiderFace 进行训练。本书使用的 VGG 网络作为 SSD 的BackBone,首先在ImageNet 数据集上训练VGG16 图像分类模型,然后使用该预训练模型的卷积层参数对SSD 网络进行初始化,最后使用具体的人脸数据对模型进行微调。基于SSD 的人脸检测模型可以达到实时检测的要求,但其检测置信度低,对小脸和模糊人脸的召回率较低。

(3)在 SSD 算法的基础上,本书又进一步进行了改进,提出了MDSSD 算法。首先,MDSSD 将检测层提前,同时在模型较低的检测层增加了两大类检测模块,用于低层纹理特征与高层语义特征的融合。其次,为了解决目标检测所面临的数据类别分布不均衡和难负样本学习困难这两大难题,MDSSD 对SSD 损失函数进行了改进,使用Focal Loss来代替分类使用的交叉熵损失函数。针对具体的数据集使用基于 IOU聚类的K-Means 聚类去寻找最佳的先验框数量、比例等参数。实验结果表明,MDSSD 人脸检测模型的检测准确率较SSD 提高了20.9%,但仍可以达到实时检测的要求。

(4)本书进一步对MDSSD 进行了量化压缩,构建了能够部署于移动端的轻量级MDSSD Lite 模型。

总体来说,模型的改进非常有效,在公开数据集上取得了较好的检测效果,能够应用于真实场景下的实时人脸检测,同时,模型的 Backbone可以替换为更深的模型。本书只针对模型的改进效果进行对比,因此其Backbone 替换文章不予讨论。但是模型仍然存在一些问题,比如,在一些人脸非常密集、上百个微小的重叠人脸的场景中,该模型的检测效果欠佳,这也是基于先验框进行采样的算法所固有的缺陷。因此,接下来的工作是进一步优化模型在非常密集场景下的检测效果。

2. 本书提出了一种基于肤色分割和模板匹配的人脸检测与识别方法。这是根据人脸肤色在YCbCr 颜色空间的聚类特性,利用人脸肤色混合高斯模型对人脸进行分割,把接近于人脸肤色的区域从图像中分离出来,并在分割区域内实现中心点的定位,从而实现对人脸的外脸迅速检测的目的,克服了传统形态学处理和边界跟踪的不足;利用光照补偿技术来克服亮度对人脸检测和识别的影响;构建眼睛提取模型来提取眼睛区域,利用自适应模板匹配来克服类肤色背景对人脸检测和识别的影响,并采用二次匹配算法来减少匹配过程中的计算量,提高了检测速度。通过提取人脸图像中的多尺度奇异值特征向量并将它应用于基于模版匹配的人脸识别算法中来识别人脸,达到了降低人脸特征提取过程中特征值矩阵维数的目的。这样,提取到的人脸图像在多种尺度下的局部特征能够更好地反映图像之间的差异,更全面地反映图像的鉴别特征,而且采用具有较好分类能力的基于模版的匹配算法,更有利于模式识别。实验表明,该方法能检测出偏转角度较大的人脸;对不同的光照条件、姿态以及干扰背景具有较强的适应性;人脸检测与识别率得到大大提高。该方法操作简单,速度较快,能满足实时处理的要求。

人脸识别系统是一种以生物特性为基础的身份辨识技术,其理论研究价值很高,而且使用也非常广泛。尤其在当今社会中,人脸识别技术的发展非常快,在很多行业中都有涉及。因此,其关注程度也在不断提升,将来在商业上的应用会变得更加广泛。

在当今使用较多的人脸识别算法中,使用最多的算法是基于子空间的人脸识别方法。以 Fisher 准则为基础的线性判别分析(LDA)方法是以线性子空间为基础的分类方式,它在模式识别行业中使用得比较多。在对人脸特性进行提取时,在使用LDA 的过程中会遇到边缘类和求解协方差矩阵不可解问题,并且小样本是一个难以解决的问题。当前,对其进行改良的方式有多种,比如Fisherfaces、D-LDA 等。这些方法都能够解决小样本问题,但在使用时又可能出现丢失部分主空间信息的问题。针对上述问题,本书设计了PSO+LDA 算法,完成的工作有下面几点:(www.xing528.com)

(1)先介绍了人脸识别的研究背景和国内外研究现状,同时介绍了三类人脸检测方法,而且对这些方法的特点和不足之处以及其使用的地方做出了剖析。另外,还介绍了多种图像的预处理方式,借助直方图均衡化处理方式,将图像的对比度进行提升,而且对光照问题做出了弥补。

(2)具体介绍了以线性子空间为基础的人脸特征获取方式:LDA算法。具体剖析了以Fisher 准则为基础的LDA 方法在获取人脸特征时存在的一些问题,而且给出了处理方式,同时提出了本书研究的PSO-LDA 算法。

(3)在人脸数据库上对本书提出的人脸识别算法——MDSSD 算法、线性判别分析法、PSO-LDA 算法进行了实验,同时对比了LBP 算法、SVM-LBP 算法和深度卷积神经网络算法的实验结果。研究发现,借助粒子群优化LDA 的方式,识别结果优于或近似于其他算法;在鲁棒性分析中,LDA 方法本身对噪声的抵抗力比较好,再加上PSO 优化之后,效果更佳。因此,引进的PSO 算法优化LDA 方法,在进行人脸识别时表现出很好的特性。

3. 人脸识别理论包含非常多的学科,而且其应用也比较广泛,本书仅仅是对人脸识别进行了初步的剖析和学习,其技术自身的发展和使用还需要进行一些改善,主要从下面几方面来进行:

(1)在收敛性以及收敛时间估算上面,还需要进行一些理论探讨。所以,在以后的探究中应着重对其理论知识做出探究,使其为算法中的一些参数进行指引。

(2)在算法前期,尽管粒子群的收敛速度比较快,但还是有一些不足之处,比如精准度不高、很难进行收敛等,所以在这方面也需要做出改良。

(3)如何将当前已经存在的所有的人脸识别方式的长处与不足进行很好的结合,用一种方法的特点去弥补另外一种方法的不足,把多种识别方式综合使用,这将是今后探讨的一个方向。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈