首页 理论教育 RPN网络在人脸检测与识别中的应用

RPN网络在人脸检测与识别中的应用

时间:2023-11-23 理论教育 版权反馈
【摘要】:RPN 网络是一个全卷积神经网络,该网络接受任意尺寸的图像输入,并输出该图像的候选目标框和目标置信分数。图3-8RPN 网络结构图RPN 网络使用n×n 的滑动窗口进行候选区域提议,其中在每个滑动窗口位置设置若干个不同大小、不同长宽比的Anchor Box 来增强模型的尺度不变性,且每个Anchor Box 的中心位于滑动窗口的中心,如图3-9 所示。这些Anchor Box 与RPN 网络输出相对应。

RPN网络在人脸检测与识别中的应用

RPN(region proposal network,RPN)即候选区域网络,是添加在FasterR-CNN 特征提取网络末端,负责生成候选区域的分支网络。之前,两阶段的Fast R-CNN, SPP Net 均使用Selective Search 进行候选区域生成,这种计算复杂且耗时,使得候选区域生成成为影响人脸检测速度最关键的因素,因此,在Faster R-CNN 中使用共享计算的卷积神经网络来代替传统算法。而RPN 网络的主要作用是提取候选目标区域和框粗回归,其实质是使用多种预设Anchor Box 对主干网的输出特征图进行滑窗,以提取不同尺度和多种长宽比的候选框。

RPN 网络是一个全卷积神经网络,该网络接受任意尺寸的图像输入,并输出该图像的候选目标框和目标置信分数。该网络的前半部分与主干网络即Fast R-CNN 共享计算,其后半部分为一个两端输出,分别为RPN 分类模块和RPN 框回归模块,分别负责候选区域分类和候选区域精准定位。其结构如图3-8 所示,主干网络输出的特征图首先进行3×3 卷积,之后在两个分路中分别进行1×1 卷积。其中,RPN 分类模块使用分类层cls layer 输出候选区域的包含人脸的置信分数,RPN 回归模块使用回归层reg layer 输出候选区域的位置向量。网络两端输出维度与Anchor Box 的数量有关。

图3-8 RPN 网络结构图(www.xing528.com)

RPN 网络使用n×n 的滑动窗口进行候选区域提议,其中在每个滑动窗口位置设置若干个不同大小、不同长宽比的Anchor Box 来增强模型的尺度不变性,且每个Anchor Box 的中心位于滑动窗口的中心,如图3-9 所示。这些Anchor Box 与RPN 网络输出相对应。具体地,若特征图大小为M×N,每个滑窗Anchor Box 数量为k,则RPN 网络输出端reg layer 的维度为4k×M×N,cls layer 输出维度为2k×M×N,输出的位置向量和置信度与滑动窗口中的Anchor Box一一对应。

图3-9 Anchor Box 示意图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈