为了更好地理解驾驶环境,无人驾驶车辆不仅需要获取周围环境中其他障碍物目标的位置,还需要实时获取周围运动目标的运动状态,包括速度、航向等信息。在真实交通场景中,周围目标种类和数量众多,运动形式多样,这就涉及多目标检测与跟踪(Detection And Tracking Multi-Objects,DATMO)或更为广义上的多目标跟踪(Multi-Objects Tracking,MOT)问题。目标跟踪是指对特定目标进行连续追踪,分配独特的ID 号并能够获取目标的历史运动轨迹以及对其将来的动作或行为进行预测。不同于单目标检测与跟踪,多目标跟踪问题的难点在于如何能够准确检测到多种类别目标并完成多目标数据关联工作,因此更具有研究挑战性。目标跟踪为无人驾驶车辆上层规划决策提供了更为有益的目标运动感知信息。
另外,目标跟踪在检测失效时至关重要,由于目标检测只是获得单帧检测结果,在一些遮挡或其他干扰情况下,检测必然会失效,此时只能依靠历史跟踪信息在检测失效时仍然能够恢复目标信息,减少漏检情况的发生。此外,交通场景中的动态障碍物容易导致即时定位与地图构建(Simultaneous Localization And Mapping,SLAM)算法出现匹配错误并影响定位精度,并且会在构建的环境地图中留下动态障碍物的轨迹,需要利用多目标跟踪输出结果对动态目标进行估计,滤除动态目标轨迹和降低动态目标对于SLAM 中误匹配的影响。
在得到了用于检测和跟踪匹配用的特征之后,MOT 问题中最核心也是最复杂的部分在于如何进行帧间的数据关联(Data Association,DA),即建立前后帧多目标之间的对应关系。从20 世纪70 年代起,研究者就提出了许多方法解决这一问题,具有代表性的有最邻近法(Nearest Neighbor Data Association,NNDA)、概率数据关联法(Probability Data Association,PDA)[Q. Pan,2005]、联合概率数据关联法(Joint Probability Data Association,JPDA)以及多假设跟踪(Multiple Hypothesis Tracking,MHT)[X. Si,2007]等。Konstantinova 等人[P. Konstantinova,2003]使用的NNDA 方法是一种工程上常用的快速简单的方法,在目标稀疏、检测稳定且干扰比较少情况下能够很好地工作,但对于复杂些的情况就难以处理。PDA 主要用于跟踪单个目标,多个目标如果间隔较远也能有不错的性能,而当目标之间的距离较近时,就有可能造成关联错误[L. Meng,2002]。JDPA 是由Fortmann 等人[T. Fortmann,1983]在PDA 理论基础上提出来的,它综合考虑了跟踪阈值内的所有检测目标的概率,在实际工程中得到了广泛的应用,但也存在运算复杂的问题。它计算每帧聚类得到的目标与所有跟踪上目标的关联程度,然后计算每个聚类的结果与某个跟踪上的目标的隶属概率,利用概率值获得观测结果。MHT 作为最大后验概率估计器,其结合了最近邻算法和联合概率数据关联的优点,是理论上最优的方法,但这种方法需要大量的存储和计算资源,难以满足实时性的要求[S. Blackman,2004]。(www.xing528.com)
Luo 等人[W. Luo,2017]将MOT 问题看作多变量估计问题,目标是找到对于所有跟踪目标最优序列状态,一般用最大化后验概率(Maximum A Posteriori,MAP)算法来建模整个问题。从目标初始化方法的角度来看,MOT问题可以被分为两类,即基于检测的跟踪(Detection Based Tracking,DBT)和无检测的跟踪(Detection Free Tracking,DFT)。DBT 方法首先检测目标,然后链接到目标轨迹中, 逐步形成目标运动轨迹, 这种策略也称为“tracking-by-detection”。Bose 等人[B. Bose,2007]利用这种方法假设已有检测目标,聚焦跟踪流程中目标轨迹丢失和多目标聚类问题的解决。Bewley 等人[A. Bewley,2016]也强调了目标检测质量的重要性,将MOT 问题的研究重点放在前后帧多目标匹配上,通过设计简单的线性卡尔曼滤波器,并结合视觉二维检测框的位置关联完成多目标跟踪过程,取得了不错的效果。相比于DBT方法,DFT 方法不需要提前训练目标检测器,但需要手动初始化第一帧中所需跟踪目标所在位置,然后在后续帧中对这些目标定位。Hu 等人[W. Hu,2012]则采用这种方法结合块空间外观特征实现了多目标跟踪。这种方法在无人驾驶实际应用中不实用。
另外,随着深度学习方法的迅速发展,学者们开始研究端到端的跟踪问题解决方案。不同于单纯的目标检测深度学习方法已经有比较成熟的卷积神经网络(Convolutional Neural Network,CNN)架构,对于跟踪问题而言,由于需要考虑前后帧相同目标的历史关联信息,网络结构更加复杂,训练过程也会更加烦琐。Sadeghian 等人[A. Sadeghian,2016]利用长短期记忆网络(Long Short Term Memory Network,LSTM)组合目标外观、运动和交互等线索信息,训练跟踪模型,实现多目标跟踪。Xiang 等人[Y. Xiang,2015]将MOT 问题建模成一个马尔科夫决策过程(Markov Decision Processes,MDP),对每个目标都建立一个MDP 模型来加以解决,使用强化学习方法来学习MDP 中的状态迁移过程,取得了不错的跟踪效果,但算法速度只有1 Hz左右。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。