首页 理论教育 服务机器人的眼睛:视觉传感器优化

服务机器人的眼睛:视觉传感器优化

时间:2023-06-24 理论教育 版权反馈
【摘要】:视觉传感器能够使机器人具有视觉感知功能,是机器人系统组成的重要部分之一。机器人视觉广义上称为机器视觉,其基本原理与计算机视觉类似。“机器视觉”,即采用机器代替人眼来做测量和判断。图4-2为典型机器人视觉系统。

服务机器人的眼睛:视觉传感器优化

视觉是人类感知外界信息的重要手段,也是机器人获取环境信息的关键组成部分。视觉传感器能够使机器人具有视觉感知功能,是机器人系统组成的重要部分之一。服务机器人视觉可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为可用的信号,让机器人能够辨识周围物体,并确定其位置。机器人视觉广义上称为机器视觉,其基本原理与计算机视觉类似。“机器视觉”,即采用机器代替人眼来做测量和判断。机器视觉主要用计算机来模拟人的视觉功能,但并不仅仅是人眼的简单延伸,更重要的是具有人脑的一部分功能,即:从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。图4-2为典型机器人视觉系统。机器视觉硬件主要包括图像获取和视觉处理两部分,而图像获取由照明系统、视觉传感器、模拟/数字转换器和帧存储器等组成。机器视觉可以实现的功能有:定位(点,圆,线,几何体,甚至不规则斑点)、测量(物体之间的距离和角度)、计数(对圆、线、交点、不规则图形、像素点)、瑕疵检测(表面凹陷、磨损、划痕、凸起)、字符识别(多角度全视野检测数字和字母)。

图4-2 典型机器人视觉系统

机器人视觉系统主要利用颜色、形状等信息来识别环境目标。以机器人对颜色的识别为例:当摄像头获得彩色图像以后,机器人上的嵌入计算机系统将模拟视频信号数字化,将像素根据颜色分成两部分,即感兴趣的像素(搜索的目标颜色)和不感兴趣的像素(背景颜色)。然后,对感兴趣的像素进行RGB颜色分量的匹配。为了减少环境光强度的影响,可把RGB颜色域空间转化到HIS颜色空间。根据功能不同,机器人视觉可分为视觉检验和视觉引导两种。

1.视觉传感器

视觉传感器是整个机器视觉系统信息的直接来源,主要由一个或者多个图形传感器组成,有时还要配以光投射器及其他辅助设备。视觉传感器的主要功能是获取足够的机器视觉系统要处理的最原始图像。图像传感器可以使用激光扫描器、线阵和面阵CCD摄像机或者TV摄像机,也可以使用最新出现的数字摄像机等。视觉传感器具有从一整幅图像捕获数以万计像素的能力,图像的清晰和细腻程度常用分辨率来衡量,以像素数量表示。

2.红外传感器

利用红外线的物理性质来进行测量的传感器称为红外传感器。红外线又称红外光,它具有反射、折射、散射、干涉、吸收等性质。任何物质,只要它本身具有一定的温度(高于绝对零度),都能辐射红外线。红外线传感器测量时不与被测物体直接接触,因而不存在摩擦,并且有灵敏度高、响应快等优点。红外传感器包括光学系统、检测元件和转换电路。

红外线传感器在机器人技术领域常用于障碍物测量(蔽障)与距离测量。红外线传感器用于距离测量时称为红外测距传感器,该传感器具有一对红外信号发射与接收二极管,发射管发射特定频率的红外信号,接收管接收这种频率的红外信号。当检测方向遇到障碍物时,红外信号反射回来被接收管接收,经过处理之后,通过数字传感器接口返回机器人主机,机器人即可利用返回的红外信号来识别周围环境的变化。红外传感器在机器人上的应用相当于人眼的功能,利用的红外测距传感器发射出一束红外光,照射到物体后形成一个反射过程,反射到传感器后接收信号,然后利用图像处理计算发射信号与接收信号之间的时间差数据,再经信号处理器处理后计算出物体的距离。

3.双目立体视觉传感器(www.xing528.com)

双目立体视觉是机器视觉的一种重要形式,它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时获得被测物的两幅数字图像,或由单摄像机在不同时刻从不同角度获得被测物的两幅数字图像,并基于视差原理恢复出物体的三维几何信息,重建物体三维轮廓及位置。双目立体视觉系统在机器视觉领域有着广泛的应用前景。

双目立体视觉三维测量基于视差原理,图4-3所示为双目立体视觉摄像机的工作原理图。双目立体视觉摄像机可广泛应用于机器视觉、自动检测、双目测距、运动采集及分析、医学影像、生物图像、非接触测量及其他科学和工业领域。双目摄像机采用平行光轴的系统结构来获取视频图像,在平行光轴的立体视觉系统中,左右两台摄像机的焦距及其他内部参数均相等,光轴与摄像机的成像平面垂直,两台摄像机的x轴重合,y轴相互平行,因此将左摄像机沿着其x轴方向平移一段距离b(称为基线,baseline)后与右摄像机重合。即使设计时完全一致,由于存在CCD焊接、镜头接口、镜头、电路板变形等因素所引起的误差,生产出来的双目摄像机所得到的图像与平行光轴结构要求之间,或多或少都存在误差。因此,在使用前,必须获得双目摄像机系统的内外部参数,让双目应用程序和算法进行相应的调整,方可得到最佳的视差。

图4-3 双目立体视觉摄像机工作原理图

4.图像识别

人类在进行图像识别时,光作用于视觉器官,使其感受细胞兴奋,其信息经视觉神经系统加工后产生视觉。视觉形成过程:光线→角膜→瞳孔晶状体(折射光线)→玻璃体(固定眼球)→视网膜(形成物像)→视神经(传导视觉信息)→大脑视觉中枢(形成视觉)。通过视觉,人和动物感知外界物体的大小、明暗、颜色、动静,获得各种信息。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像距离的改变或图像在感觉器官上作用位置的改变,都会造成图像在视网膜上的大小和形状的改变。即使在这种情况下,人们仍然可以认出他们过去知觉过的图像。甚至图像识别可以不受感觉通道的限制。例如,人可以用眼看字,当别人在他背上写字时,他也可认出这个字来。

机器人的图像识别过程与人类相似,是以图像的主要特征及颜色为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映像。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫作组块,每一个组块是同时被感知的。在文字材料的识别中,人们不仅可以把一个汉字的笔画或偏旁等单元组成一个组块,而且能把经常在一起出现的字或词组成组块单位来加以识别。

图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型,如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如:有一个字母A,如果在大脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与大脑中的模板完全符合才能加以识别,而事实上人不仅能识别与大脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。

为了解决模板匹配模型存在的问题,格式塔心理学家又提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。这种模型从神经上和记忆探寻的过程上来看,都比模板匹配模型更适宜,而且还能说明对一些不规则的,但某些方面与原型相似的图像的识别。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈