我们综合采用5 种位姿估计和全透视投影模型参数评价指标[Y. Wang,2018;A. Grabner,2019]。这些评价指标分别是衡量三维旋转准确度的旋转误差[S. Tulsiani,2015;G. Pavlakos,2017]、衡量三维平移准确度的相对距离误差、衡量内参准确度的相对焦距误差和衡量投影矩阵准确度的三维点投影平均距离误差[T. Hodaň,2016]。各项指标具体说明和形式化表述如下。
(1)旋转误差。给定旋转矩阵的估计值R 和真值Rgt ,旋转误差计算为二者间的测地线距离,即
(2)平移误差。给定平移参数的估计值t 和真值 tgt ,采用真实值对误差进行归一化,从而保证距离度量尺度的一致性,有
在评价试验结果时,汇报了 et 的中位数以衡量平移误差。
(3)位姿估计误差。给定六自由度位姿参数的估计值T 和真值Tgt,以及三维模型的点云M,采用点云在三维空间刚体变换前后的归一化平均距离表示位姿估计误差,有
式中: T ( X)=RT +t 表示三维空间刚体变换。为了使距离误差的测度对不同模型具有尺度不变性,使用三维模型投影包围盒的对角线长度dbbx 和图像的对角线长度dimg 消除量纲。在评价试验结果时,汇报了eR,t 的中位数MedErrR,t 以衡量位姿估计误差。(www.xing528.com)
(4)焦距误差。给定相机焦距的估计值f 和真值fgt,采用真实值对误差进行归一化,从而保证焦距度量尺度的一致性,有
在评价试验结果时,汇报了ef 的中位数MedErrf 以衡量焦距误差。
(5)投影模型误差。给定全透视投影模型参数的估计值P 和真值Pgt,以及三维模型的点云M,采用三维点通过投影模型投影到二维图像平面的平均距离误差表示投影模型误差,有
在试验过程中,采用[Y. Wang,2018]提出的训练集和测试集划分方式进行训练和测评。与之不同的是,由于我们提出的分类子网络中的全连接层需要固定输入图像的尺寸,所有输入图像都被填充并重新调整尺寸为512×512。通过这种方式,在训练时采用的批处理数大小为32。我们的编码器主干网络使用了ResNet−50 在大规模分类数据集ImageNet[J. Deng,2009]上的预训练权重进行初始化;解码器网络中的权重则采用何等人[K. He,2015]提出的方法进行初始化。在训练期间,采用Adam 优化器并设置学习率为0.001,每迭代20轮将学习率衰减为原来的一半。为了增强模型的鲁棒性,在训练中采用了随机的训练数据增强,如随机剪裁、镜像翻转、平面旋转、添加噪声图像块、随机模糊处理和改变颜色空间等。为了能平衡多个任务共同学习,根据不同任务损失的大小设置了超参数λfield=1.0,λseg=λcls=λt=10.0,λR=100.0。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。