本书中,我们研究一种特殊的感知方式:光电感知。顾名思义,在光电感知系统中,成像系统接收到的信号是光(包括看得见的光和看不见的光),然后,通过光电转换技术,把接收到的光以电信号(阵列)的形式记录下来,形成图像。
需要指出的是,光电转换技术并不是成像的唯一手段,例如早期的胶卷,通过化学反应的形式将光的强弱转化为析出银离子的多少,光越强,析出的银离子就越多,对应位置就会越白;相反,光越弱,析出的银离子就越少,对应位置就会越黑。胶卷上的黑白亮度分布模式是:对(照射到对应位置的)光强的转化记录结果。随着电子技术的飞速发展,成像技术也发生了巨大变化,光信号(包括可见光和不可见光)被直接转换为电信号,相应的“图像”也以“电信号阵列”的形式被保存了下来,这个过程被称为“光电”转换。采用光电转换技术的一个重要原因是电信号易于和图像处理、机器视觉等(电路)系统相结合,甚至直接作为这些系统的输入。
通过“光电”转换,我们将对场景的测量结果,以电信号阵列的形式保存成图像信号;进而,机器视觉系统通过分析图像,来生成一个关于被成像物体(或场景)的描述信息,如图1.2所示。这些描述必须包含:关于被成像物体的某些方面的信息;而这些信息将被用于:实现某些特殊的任务。因此,我们把光电感知系统看作是:一个与周围环境进行交互的实体(例如机器人、无人车)中的一部分。感知系统作为(关于场景的)反馈回路中的一个单元,用以获取信息,而其他的单元则被用来:1)做决策,2)执行这些决策。
光电感知系统包括:光电成像系统和机器视觉系统,两个系统是级联关系(如图1.2所示)。光电成像系统对场景进行测量,将测量结果以电信号阵列的形式保存成图像(或图像序列);机器视觉系统的输入是图像(或者图像序列),系统的输出是一个描述。这个描述需要满足下面两个准则:
1.这个描述必须和被成像物体(或场景)有关;
2.这个描述必须包含:完成指定任务所需要的全部信息。第一个准则保证了:这个描述在某种意义上依赖于视觉输入;而第二个准则保证了:视觉系统的输出信息是有用的。
对物体的描述并不总是唯一的。从许多不同的观点和不同的细节层次上,我们都可以构造出:对物体的不同描述。因此,我们无法对物体进行“完全的”描述。幸运的是,我们可以避开这个潜在的哲学陷阱,而只去考虑:针对某一特殊任务的某种有效描述,也就是说,我们所需要的并不是关于被成像物体的所有描述,而只是那些有助于我们进行正确操作的描述。(www.xing528.com)
图1.2 光电感知系统包括两部分:成像仪器对场景进行测量,生成(电信号阵列形式的)图像;机器视觉系统根据图像生成一个关于被成像物体(或场景)的符号描述。生成的描述将被用于:指导机器人系统与周围环境进行交互。
在各个领域的发展过程中,都有这样的现象:随着该领域的不断发展,一些早期的方法不得不被舍弃掉,新的概念被不断引入。尽管有时这会让人感到沮丧,但是,在寻找问题解决方案的过程中,这也是使人感到非常刺激的一件事情。例如,有人认为并不一定非得去理解图像的生成过程;另一些人则过度迷恋于一些没有太大通用性的启发式方法和特殊技巧。本书中,我们始终坚持
•从信号测量和信息提取两个过程来深刻理解光电感知!这个观点使得我们可以推导出:用于进行图像分析的数学模型,而那些“从图像中恢复出对被成像场景的描述”的算法,正是基于这些数学模型来实现的。本书所提出的一些方法,在将来的某一适当时候,无疑会被改进或舍弃。这个领域的发展实在是太快了!
当然,基于成像分析的方法,并不是光电感知的唯一研究方法。另一方面,人们可以从已知的生物视觉系统出发,来研究光电感知系统。使用这种方法所设计的智能系统,将基于神经网络系统的复杂理论(假设这些基于神经系统的理论足够有代表性)。对于光电感知中的给定问题,我们应该不断尝试各种不同的方法,但是为了避免内容的混乱,本书只重点讨论:基于成像分析的信息提取方法!
图1.3 我们幸运地找到了三位MIT科学家Patrick W inston(左),Berthold K.P.Horn(中)和Eugene Freuder(右)在设计“结构复制”演示系统时的一张合影。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。