近年来,自动视觉监控系统已取得了很大的进步。过去功能受限的单摄像机系统(识别和跟踪目标)[574,225,509],已经发展成为具有多个传感器网络的大型系统,可以进行大面积视频分析[119,167,485,131,518]。这种系统旨在提供站点范围内的情景感知,通过以下3个方面来实现:①从描述现场的视频中提取有用的元数据,对现场的描述包括动静态目标及其相互作用与行为;②融合从多个传感器提取的信息;③用一种用户方便的方式呈现出来。直到最近,对于一些常见的问题,如目标识别、持续跟踪、目标分类以及数据融合,大多数系统均可以单独处理,且能试图推断现场中单个目标的属性,而无需考虑单个目标之间的相互作用、场景环境及其先前的观测值。由于这些系统的无记忆性,使它们没有学习环境参数的能力,进而不能根据这些参数得出智能推理。
大量研究给出了有力的心理学证据,场景的上下文对人们进行场景理解非常重要,如长期遮挡的处理、异常行为的检测、甚至目标跟踪检测中、低层视觉任务的改进[61,534]。我们认为,智能摄像机经过一段工作时间,能根据观测值来对场景建模,而且能提高基于此模型的性能。得出一些推论需要高级知识,这些知识来自领域知识、过去经验、时序一致性以及场景几何形状,例如,被识别的路径、道路、场景出入口,学习到的子事件之间的因果关系,以及学习到的该区域的流量和目标的行为模式。当场景中存在灌木丛,有目标通过这里时,则只能观测到一部分目标或观测不到目标。现存的大多数系统只有当目标从灌木丛出来时才能检测到它,而无法将遮挡前后目标的观测值联系起来。在特定地方特定的时间间隔,目标消失与出现,当这种行为能被持续观测到时,智能摄像系统可以推断这些观测值之间的联系,然后,当目标再现时,根据这些观测值就能正确识别。我们认为这些过程及其相关参数的识别、建模和分析对实现自主式智能决策很关键。本章中,我们将通过例子来说明,使用场景上下文、特定的领域知识和先验知识,如何使视觉监控系统的适应性和实用性成为可能,以及如何解决视觉监控系统的典型问题,这些问题包括传感器校正、地理注册、行为预测、场景中异常模式的检测、前景检测的改善、目标分类和目标的持续跟踪。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。