对于目标运动的视觉感知问题,是视觉信息感知与识别中的第二层次问题,不同于第2章中根据静止图像信息进行分析处理,这里主要是指从包括目标时变运动信息的视频中自动地检测出需要分析的运动目标,并对目标的运动轨迹进行持续的跟踪实现运动特征的有效提取和描述,以期完成对运动目标行为的识别和理解。而传统的基于二维视频的分析方法受到遮挡、阴影、光照等方面的制约,使得检测失败和丢失跟踪的情况时有发生,严重影响了感知识别性能的提高。
目标跟踪广泛应用于人类日常生活和工作以及军事安防等各个方面。利用智能监控跟踪系统,通过对目标运动轨迹等信息的分析来判断异常,从而起到预警的作用,充分保障了社会安全,将智能监控系统用于事故频发路段,自动化地跟踪特定车辆,可以有效降低相关工作人员的工作强度并防止因疏忽等原因造成的事故,从而有效地提高工作效率;在医疗诊断中,通过对癌细胞的判断以及癌细胞扩散位置的预测,可以有效地预防和诊断癌症等疾病;通过红绿灯检测、障碍物检测、行人及车辆跟踪并预测轨迹等环境感知的关键技术,辅助自动驾驶技术更好更快的应用落地,影响着人类的出行方式;同时使计算机能够理解人的肢体、手势、表情等动作的不同含义,制作出的体感游戏为人们的生活增添了很多乐趣。因此,具有超越人眼的精度以及实时速度的跟踪算法成为了广大学者追求的目标。
根据跟踪目标数量的不同,目标跟踪算法可分为单目标跟踪(Single Object Tracking,SOT)与多目标跟踪(Multiple Object Tracking,MOT)。其中,前者的跟踪对象一般只有一个,且假设目标始终在视域内;而后者的目标数量不定,且目标可能频繁进入或者离开视域,因此具有更大的挑战性,本章将分别进行介绍。
真实场景下目标跟踪算法面临着“表观相似目标的干扰”“目标交互或遮挡”“算法模型参数量大且运算复杂度高”三个较为突出的难点。
(1)表观相似目标干扰问题。表观相似是指相邻的两个或者多个目标具有相似外观的现象,该现象导致了目标之间区分困难。例如:在监控场景下,目标一般较小且表观细节不明显,同时目标背景相对杂乱,当目标的背景中出现与其外观非常相似的其他目标时,容易发生目标与背景无法区分的现象。因此,表观相似目标的干扰问题极大影响了目标跟踪算法的性能。(www.xing528.com)
(2)目标交互或遮挡问题。目标交互问题是指因目标与目标轨迹重叠而导致的目标部分或全部不可见现象,物体遮挡问题是指目标与其他非目标物体位置重叠而导致的目标部分或全部不可见现象,统称为目标交互或遮挡问题。由于行人运动的随机性,该问题在密集场景中更为常见。例如:在自动驾驶场景下,传感器视域中一般会同时出现多个目标行人,场景包含的路灯、建筑物又可能对行人造成遮挡,影响了目标的识别与定位。因此,目标交互或遮挡问题对目标跟踪算法提出了极大挑战。
(3)算法模型参数量大且运算复杂度高问题。现有目标跟踪算法往往采用了深度学习模型,出现了模型参数量大导致存储占用大的现象,以及模型运算复杂度高导致算法实时性差的现象。例如:在无人机追踪等应用场景中,硬件设备的存储空间一般较小且计算资源不足,无法存储过大的模型,同时该场景对算法实时性要求高,运算复杂度过高的模型可能造成不可接受的时延。因此,算法模型参数量大且运算复杂度高问题制约了目标跟踪算法的落地。
本章将从视觉感知的角度出发,重点研究融合时空信息的运动目标分析,包括基于循环神经网络的单目标跟踪算法和融合时空上下文的多目标跟踪算法,既包括单目标的运动检测与跟踪,也包括多目标的量测生成和数据关联,同时包括相关算法的性能对比。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。