基于图像模式识别的一般过程通常包含图像采集、图像存储、图像预处理、图像变换、特征提取、目标识别等过程,如图5-4所示。
图5-4 图像模式识别的一般过程
(1)图像采集
在图像采集阶段,所要识别的图像通过图像采集系统采集进来。图像采集系统主要由镜头、图像传感器、图像采集卡组成。
一般情况下,除了通过扫描仪或其他特殊图像采集设备进行图像采集时,图像采集系统大都配有镜头。镜头又分为定焦镜头和变焦镜头,其中对于图像处理比较重要的参数包括景深、视场角、焦距以及光圈。这部分内容涉及的知识点较多,本书不展开讲解,读者可以自行查阅相关理论。
常见的图像传感器一般有CCD和CMOS两种。CCD又称电荷耦合元件,是一种半导体器件,它上面许多的感光单元能够把光学影像转化为数字信号,而每一个感光单元被称作像素。CCD以其优异的成像质量和响应速度成为目前应用最为广泛的图像传感器之一。CMOS又称互补金属氧化物半导体,其工作原理与CCD类似,主要区别在于材料。CMOS的成像质量普遍较CCD差,但其也有功耗低、价格低的优点。不过,随着技术的进步,CCD和CMOS的差异正在缩小。
图像采集卡用于将摄像头采集到的模拟图像信号转化为计算机能够识别的信号并输入计算机中,常用于中低端安防监控领域。高端或者定制的图像采集系统中,系统自带图像压缩芯片,直接输出数字图像信号,这时就不再需要单独的图像采集卡。
(2)图像存储
图像在被采集之后,就需要进行存储。图像存储涉及两个要素:文件格式和存储体系。
图像文件格式多种多样,但不同场合使用的图像格式却不完全一样。互联网中一般使用GIF、JPG、PNG类格式的图像,而印刷中用的比较多的是TIF、JPG、TAG、PCX格式,符合国际标准的图像格式为TIF和JPG。不过目前能够进行图像格式转化的方法有很多,图像格式对于图像处理来说已不是制约效果的关键因素。
图像识别系统的搭建过程中,需要考虑图像存储的硬件体系,依据图像处理要求的不同会有不同的存储方案。具体的存储体系可分为内存存储、硬盘存储、备份存储、分级存储和网络存储。其中,应用最广泛的当属内存存储、硬盘存储和备份存储。内存存储主要应用于图像处理;硬盘存储主要用于图像处理和在线备份;备份存储除了在线备份外,还包括近线存储和离线存储,可以使用光盘等存储介质。
(3)图像预处理
为了获得更适合处理和识别的图像,需要先将图像数据根据所要应用的识别方法进行优化,即进行图像预处理。图像预处理的方法很多,包括空间域的方法和频率域的方法,主要目的有两个:一是改善图像的视觉效果,提高图像的清晰度;二是将图像转换成一种更适合于人类或机器进行分析处理的形式,以便从图像中获取更多有用的信息。常用的方法为直方图增强和图像平滑等。(www.xing528.com)
直方图能够反映数字图像的概貌性描述,例如图像的灰度范围、灰度的分布、整幅图像的平均亮度和明暗对比度等,并可以由此得出进一步处理的重要依据。但是同时,直方图与图像之间并非一一对应关系,它不能完整地描述一幅图像。对直方图进行修正往往可以增大反差,使图像细节清晰,达到图像增强的目的。常用方法有直方图均衡化和直方图规定化。
图像平滑主要用于消除图像中的噪声,也即消除各类外界干扰。平滑噪声又分为在空间域中进行或在频率域中进行两类。空间域平滑的基本方法是求像素灰度的平均值或中值,常见方法有多图像平均法、邻域平均法、中值滤波等。每种方法各有特点:多图像平均法需要多幅图像,实现困难;邻域平均法在平滑噪声的同时,却使图像变模糊,降低了图像质量;中值滤波能够在较好保持图像原貌的同时滤除噪点,是一种较为理想的去噪方法。为了既平滑噪声又保护图像信号,也有一些改进的技术,比如在频域中运用低通滤波技术。
(4)图像变换
图像变换是为了达到某种目的,而将原始图像变换映射到另一个空间上,使得图像的某些特征得以突出,以便于后续处理和识别的变换。一般变换后的图像,大部分能量都分布于低频谱段,这对以后图像的压缩、传输都比较有利。
常用的图像变换方法有空间变换、傅里叶变换、余弦变换、小波变换、Walsh-Hadamard变换、Hough变换和K-L变换等,更多更深入的内容参见第二章。
(5)特征提取
图像的特征有很多,从视觉特征来看可以归纳为颜色特征、形状特征、纹理特征和空间层次关系特征四类。
其中,基于颜色特征的识别技术主要针对彩色图像,通过颜色直方图具有的简单且对于图像的大小、旋转变换不敏感等特点进行分类识别。基于形状特征的识别方法,其关键是找到图像中目标的形状并对此进行描述,以完成不同图像的分类,往往需要对目标的边缘轮廓、形状、重心等参数进行提取。基于纹理特征的识别方法是通过对图像中具有结构规律的特征加以分析或是对图像中的色彩强度的分布信息进行统计来完成。基于空间层次的识别方法则需要根据立体目标各部分的层次关系判断出其在图像中的方向和位置。
针对不同应用许许多多的特征提取方法,具体已在第四章中有详细的介绍,这里就不再展开。
(6)目标识别
目标识别是将目标从其他景物中区分出来的过程。目标识别从识别对象上来看,可分为二维图形识别和三维目标识别。
在对二维图形进行识别时,需要考虑的因素除了目标在图像中的大小、旋转和位置外,还有背景、光照、噪声等的影响。这就可能会导致识别算法复杂、信息处理量大、计算量大等问题,在工程应用中,还需要考虑识别算法的实时性问题;而在对三维目标进行识别时,除了存在同识别二维图形一样的困难外,还需要考虑三维目标不同角度观察时存在差异所带来的影响,难度更大。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。