首页 理论教育 R-CNN算法的分类判定及候选框变换过程

R-CNN算法的分类判定及候选框变换过程

时间:2023-06-30 理论教育 版权反馈
【摘要】:R-CNN算法使用经过训练的线性SVM分类器对所提取的特征进行分类,针对每个类别的分类,R-CNN都专门训练一个线性SVM分类器。在R-CNN结构模型还通过对候选框采取变换的方式来提高对目标进行定位的精度变换参数。对候选框的变换主要根据对CNN模型的微调过程中训练得出,这个过程称为候选框回归。,N,其中,Pi表示第L个候选框的位置。

R-CNN算法的分类判定及候选框变换过程

该阶段根据上一阶段所提取的图像候选区域特征进行分类判定。R-CNN算法使用经过训练的线性SVM分类器对所提取的特征进行分类,针对每个类别的分类,R-CNN都专门训练一个线性SVM分类器。

R-CNN结构模型中的CNN模型使用了在ILSVRO(Imagenet Large Scale Visual Recognition Competition)大数据集上训练过(Pretrained)的Alex Net模型,并且在小数据集PASCAL上进行参数微调(Fine-tuning),这样经过参数微调出来的模型能够比直接使用训练过的Alex Net模型性能提高8个百分点。在为分类器的训练准备训练数据的过程中,将包含目标的候选区域标记为正样本,背景区域标记为负样本,对于与目标重叠的候选区域而言,采用重叠区域比率阈值的方法进行处理,将与目标重叠区域占比超过0.3的候选区域标记为正样本,目标重叠区域占比低于0.3的候选区域标记为负样本。

R-CNN结构模型在对测试样本进行目标定位的过程中,对于在测试样本上产生的正样本也就是待定位目标的候选区域进行非极大值抑制(Nonmaximum Suppression,NMS),非极大值抑制算法的流程如下:

(1)保留每个类别中得分最高的候选区域。

(2)在每个类别剩下的候选区域中,去除掉与上一个该类别保留的候选区域重叠区域比率大于一定阈值的候选区域。

(3)在剩下的候选区域中保留得分最高的候选区域

(4)重复步骤(2)~(3)直到该类别在步骤(2)中没有候选区域。

(5)每个类别所有保留下来的候选区域作为该类别目标的检测结果。

非极大值抑制对过滤相互重叠率高的候选区域提高最后输出的检测结果的质量起着很大的作用。

在R-CNN结构模型还通过对候选框采取变换的方式来提高对目标进行定位的精度变换参数。对候选框的变换主要根据对CNN模型的微调过程中训练得出,这个过程称为候选框回归(Bounding box Regression)。(www.xing528.com)

候选框变换参数训练过程的输入是N个训练对{(Pi,Gi)}i=1,…,N,其中,Pi表示第L个候选框的位置。表示第i个候选框中心点的横坐标和纵坐标表示第i个候选框的宽度和高度,Gi表示第i个候选框所对应的真实目标框(Ground-truth boxes)的位置。如果Pi与任意真实框的位置Gk都不重叠或者重叠部分很少那么此时将Pi变换为Gi没有任何意义,因此在选择训练对中的Pi时,设候选框集合,真实目标框集合G=[6]

【注释】

[1]李德毅.人工智能导论[M].北京:中国科学技术出版社,2018:126.

[2]LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11).

[3]王晓锋,马钟.基于卷积神经网络LeNet-5的货运列车车号识别研究[J].现代电子技术,2016,39(13).

[4]文常保,茹锋.人工神经网络理论及应用[M].西安:西安电子科技大学出版社,2019:117.

[5]衣柳成,魏伟波,刘小芳.基于GoogLeNet的智能录播系统中站立人脸的检测与定位[J].青岛大学学报(自然科学版),2019,32(4).

[6]陈慧岩.智能车辆理论与应用[M].北京:北京理工大学出版社,2018:71.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈