首页 理论教育 机器视觉中的视觉传感器及其重要性

机器视觉中的视觉传感器及其重要性

时间:2023-06-27 理论教育 版权反馈
【摘要】:视觉传感器就是我的眼睛,它是整个机器视觉系统中视觉信息的直接来源,主要由一个或两个图形传感器组成,有时还要配以光投射器及其他辅助设备。视觉传感器的主要功能是获取可供机器视觉系统处理的最原始图像。谈起视觉传感器,人们就会想到CCD与CMOS两大视觉感应器件。因此视觉系统在机器人技术中具有重要的作用。依据所用视觉传感器的数量和特性,目前主流的移动机器人视觉系统可分为单目视觉、双目立体视觉、多目视觉和全景视觉等。

机器视觉中的视觉传感器及其重要性

视觉传感器就是我的眼睛,它是整个机器视觉系统中视觉信息的直接来源,主要由一个或两个图形传感器组成,有时还要配以光投射器及其他辅助设备。视觉传感器的主要功能是获取可供机器视觉系统处理的最原始图像。图像传感器可以使用激光扫描器、线阵和面阵CCD(电荷耦合器件)摄像机或者TV(视频会议摄像机,还可以是最新出现的数字摄像机等[50]

谈起视觉传感器,人们就会想到CCD与CMOS两大视觉感应器件。CCD是一种用电荷量表示信号大小,用耦合方式传输信号的探测元件,具有自扫描、感受波谱范围宽、畸变小、体积小、重量轻、系统噪声低、功耗小、寿命长、可靠性高等—系列优点,并可做成集成度非常高的组合件[51]。在人们的传统印象中,CCD代表着高解析度、低噪点等“高大上”品质,而CMOS由于噪点问题,一直与电脑摄像头、手机摄像头等对画质相对要求不高的电子产品联系在一起。但是现在CMOS今非昔比了,鸟枪换炮,其技术有了巨大进步,基于CMOS的摄像机绝非只局限于简单的应用,甚至进入了高清摄像机行列[52]。为了更清晰地了解CCD和CMOS的特点,现在从CCD和CMOS的不同工作原理说起。

机器人视觉系统是指用计算机来实现人的视觉功能,也就是用计算机来实现对客观的三维世界的识别[53]人类接收的信息70%以上来自视觉,人类视觉提供了关于周围环境的最详细、最可靠、最周全的信息。

人类视觉所具有的强大功能和完美的信息处理方式引起了智能研究者的极大兴趣,人们希望以生物视觉为蓝本研究一个人工视觉系统,并将其运用于机器人系统中,期望机器人因而拥有类似人类感受环境的能力。机器人要对外部世界的信息进行感知,就要依靠各种传感器。与人类一样,在机器人的众多感知传感器中,视觉系统提供了大部分机器人所需的外部世界信息。因此视觉系统在机器人技术中具有重要的作用。

依据所用视觉传感器的数量和特性,目前主流的移动机器人视觉系统可分为单目视觉、双目立体视觉、多目视觉和全景视觉等。

其中,单目视觉系统只使用一个视觉传感器,故此而得名。单目视觉系统在成像过程中由于从三维客观世界投影到二维图像上,从而损失了深度信息,这是此类视觉系统的主要缺点(尽管如此,单目视觉系统由于结构简单、算法成熟且计算量较小,在自主移动机器人中已得到广泛应用,如用于目标跟踪、基于单目特征的室内定位导航等)。同时,单目视觉也是其他类型视觉系统的基础,如双目立体视觉、多目视觉等都是在单目视觉系统的基础上,通过附加其他手段和措施而实现的[54]。(www.xing528.com)

双目视觉系统由两个摄像机组成,利用三角测量原理获得场景的深度信息,并且可以重建周围景物的三维形状和位置,类似人眼的体视功能,原理简单[55]。双目视觉系统需要精确地知道两个摄像机之间的空间位置关系,而且需要两个摄像机从不同角度,同时拍摄同一场景的两幅图像,并进行复杂的匹配,才能准确得到场景环境的3D信息。立体视觉系统能够比较准确地恢复视觉场景的三维信息,在移动机器人定位、导航、避障和地图构建等方面得到了广泛的应用。然而,立体视觉系统的难点是对应点的匹配,该问题在很大程度上制约着立体视觉在机器人领域的应用与推广。

多目系统采用三个或三个以上摄像机(三目系统居多),主要用来解决双目立体视觉系统中匹配多义性问题,以提高匹配精度。多目视觉系统最早由莫拉维克研究,他为“Stanford Cart”研制的视觉导航系统采用单个摄像机的“滑动立体视觉”来实现;雅西达提出了采用三目立体视觉系统来解决对应点匹配的问题,真正突破了双目立体视觉系统的局限,并指出在以边界点作为匹配特征的三目视觉系统中,其三元的匹配准确率比较高;艾雅湜提出了用多边形近似的边界点段作为特征的三目匹配算法,并用到移动机器人中,取得了较好的效果,三目视觉系统的优点是充分利用了第三个摄像机的信息,减少了错误匹配,解决了双目视觉系统匹配的多义性,提高了定位精度,但三目视觉系统要合理安置三个摄像机的相对位置,其结构配置比双目视觉系统更烦琐,而且匹配算法更复杂,需要消耗更多的时间,实时性更差。

全景视觉系统是具有较大水平视场的多方向成像系统,突出的优点是有较大的视场,可以达到360°,这是其他常规镜头无法比拟的。全景视觉系统可以通过图像拼接的方法或者通过折反射光学元件实现。图像拼接的方法使用单个或多个相机旋转,对场景进行大角度扫描,获取不同方向上连续的多帧图像,再用拼接技术得到全景图。折反射全景视觉系统由CCD摄像机、折反射光学元件等组成,利用反射镜成像原理,可以观察360°的场景,成像速度快,能满足实时性要求,具有十分重要的应用前景,可以应用在机器人导航中。全景视觉系统本质上也是一种单目视觉系统,也无法得到场景的深度信息。其另一个特点是获取的图像分辨率较低,并且图像存在很大的畸变,从而会影响图像处理的稳定性和精度。在进行图像处理时首先需要根据成像模型对畸变图像进行校正,这种校正过程不但会影响视觉系统的实时性,而且还会造成信息的损失。另外,这种视觉系统对全景反射镜的加工精度要求很多,若双曲反射镜面的精度达不到要求,利用理想模型对图像校正则会存在较大的偏差。

混合视觉系统吸收了各种视觉系统的优点,采用两种或两种以上的视觉系统组成复合视觉系统,多采用单目或双目视觉系统,同时配备其他视觉系统。全景视觉系统由球面反射系统组成,其中全景视觉系统提供大视角的环境信息,双目立体视觉系统和激光测距仪检测近距离的障碍物,清华大学的朱志刚等人使用一个摄像机研制了多尺度视觉传感系统POST,实现了双目注视、全方位环视和左右两侧的全景成像,为机器人提供了导航信息。全景视觉系统具有视场范围大的优点,同时又具备双目视觉系统精度高的长处,但是该类系统配置复杂,费用较高。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈