图像处理就是对给定的图像进行某些变换,从而达到改善图像质量或将其变换成适合于计算机处理或识别的形式[11]。通常所说的数字图像处理的研究目的是将原图像的灰度分布作某种变换,使图像中的某部分信息更加突出,以便其适应于某种特殊的需求。数字图像处理技术精度比较高,而且还可以通过改进处理软件来优化处理效果。总的来说,数字图像处理包括以下几项内容:
1.图像运算
图像运算指以图像为单位进行的搡作(该操作对图像中的所有像素同样进行),运算的结果是一幅其灰度分布与原来参与运算图像灰度分布不同的新图像。具体的运算主要包括算术和逻辑运算,它们通过改变像素的值来得到图像增强的效果。
算术运算是指对两幅或两幅以上的输入图像中对应像素的灰度值作加、减、乘或除等运算后,将运算结果作为输出图像相应像素的灰度值。这种运算的特点在于:其一,输出图像像素的灰度仅取决于两幅或两幅以上的输入图像的对应像素灰度值,和点运算相似,算术运算结果和参与运算像素的邻域内像素的灰度值无关;其二,算术运算不会改变像素的空间位置。
逻辑运算又称为布尔运算。布尔用数学方法研究逻辑问题,成功地建立了逻辑运算。他用等式表示判断,把推理看作等式的变换。这种变换的有效性不依赖人们对符号的解释,只依赖于符号的组合规律。这一逻辑理论被称为布尔代数。逻辑运算通常用来测试真假值,最常见到的逻辑运算就是循环的处理,用来判断是否该离开循环或继续执行循环内的命令。图像的逻辑运算主要应用于图像增强、图像识别、图像复原和区域分割等领域,与代数运算不同,逻辑运算既关注图像像素点的数值变化,又重视位变换的情况。在MATLAB中,提供了一些逻辑运算函数,表6.2给出了这些图像的逻辑运算函数。
表6.2 图像逻辑运算函数
2.几何变换
图像几何变换又称为图像空间变换,它将一幅图像中的坐标位置映射到另一幅图像中的新坐标位置。几何变换的关键就是要确定这种空间映射关系,以及映射过程中的变换参数。几何变换不改变图像的像素值,只是在图像平面上进行像素的重新安排。一个几何变换需要两部分运算:首先是空间变换所需的运算,如平移、旋转和镜像等,需要用它来表示输出图像与输入图像之间的“像素”映射关系;此外,还需要使用灰度插值算法,因为按照这种变换关系进行计算,输出图像的像素可能被映射到输入图像的非整数坐标上。
1)平移
平移变换时,如果图像的尺寸未变大,那么可能出现图像只能保存部分,被移出图像的部分需要补0或者255,这将会使得图像的部分信息丢失。
2)旋转
图像的旋转变换是指以图像的中心为原点,将图像上的所有像素点旋转一个相同个角度。和平移一样,变换后的也可能会出现空白区域,需要填补。在MATLAB中,函数imrolate()可以用来实现对图像的旋转变换。假设旋转的角度为α,那么变换公式如下:
3)镜像
图像的镜像变换并不改变图像的形状,其类型主要包括水平镜像变换、垂直镜像变换、对角线镜像变换三种类型。其中,对角镜像可以看成是水平镜像和垂直镜像的复合变换。假设图像的高度为h,宽度为w,那么三种镜像变换公式对应如下:
4)裁剪
顾名思义,裁剪就是在原图像中提取一部分图像出来。提出出来的图像可以是规则的矩形,也可以是不规则的多边形。在MATLAB中,提供了imcrop()函数来对图像进行裁剪操作。
5)缩放
图像的缩放指的是按照一定的比例对图像的两个坐标轴进行缩放而获得新图像,若两个轴的比例相同,则成为全比例缩放。图像的缩放可能会造成图像的畸变。图像的缩小是通过减少像素的个数来实现的,因此需要选择保留的像素点使得尽量能够保证图像的基本信息特征。常用的方法有等间隔采样法和局部均值法。等间隔采样就是通过相同的间隔就近采取像素点作为保留的点,而局部均值就是利用等间隔构成的图像子块求得子图块像素均值作为保留点。图像的放大需要更多的像素来填充放大后的无像素区域,一般采用最近邻域法和线性插值法。最近邻域法是按照最近的像素填充该区域而现象插值法是根据周围四份像素点的距离比有四个邻域的像素灰度值进行线性插值得出该区域各个像素点的灰度值。MATLAB中,imresize()函数默认的是最近邻域法。图像的缩放变换表达式如下:
(www.xing528.com)
6)错切
图像的错切变换实际上就是平面金乌在投影平面上的非垂直投影,分为水平方向的错切与垂直方向的错切。图像的旋转可以分解为三次错切来实现。两种错切公式如下:
3.图像增强
图像增强的作用主要是突出图像中重要的信息,同时减弱或去除不需要的信息[12]。一般可分成两大类:频率域法和空间域法。前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。后者空间域法中具有代表性的算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。
图像增强的方法是通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。图像增强技术根据增强处理过程所在的空间不同,可分为基于空域的算法和基于频域的算法两大类。空域法是对图像中的像素点进行操作,用公式描述如下:
其中是f(x,y)是原图像;h(x,y)为空间转换函数;g(x,y)表示进行处理后的图像。
基于空域的算法处理时直接对图像灰度级做运算,基于频域的算法是在图像的某种变换域内对图像的变换系数值进行某种修正,是一种间接增强的算法。
4.图像复原
图像复原的主要目的是去除干扰和模糊,从而恢复图像的本来面目,图像复原技术主要是针对成像过程中的“退化”而提出来的,而成像过程中的“退化”现象主要指成像系统受到各种因素的影响,诸如成像系统的散焦、设备与物体间存在相对运动或者是器材的固有缺陷等,导致图像的质量不能够达到理想要求。图像的复原和图像的增强存在类似的地方,它也是为了提高图像的整体质量。但是与图像复原技术相比,图像增强技术重在对比度的拉伸,其主要的目的在于根据观看者得喜好来对图像进行处理,提供给观看者乐于接受的图像,而图像复原技术则是通过去模糊函数去除图像中的模糊部分,还原图像的本真。其主要采用的方式是同采用退化图像的某种所谓的先验知识来对已退化图像进行修复或者是重建,就复原过程来看可以将之视为图像退化的一个逆向过程。图像的复原,首先要对图像退化的整个过程加以适当的估计,在此基础上建立近似的退化数学模型,之后还需要对模型进行适当的修正,以对退化过程出现的失真进行补偿,以保证复原之后所得到的图像趋近于原始图像,实现图像的最优化。
5.图像形态学处理
图像形态学是数学形态学的延伸,是一门独立的研究学科。利用图像形态学处理技术,可以实现图像的腐蚀、膨胀和分割等效果。
1)腐蚀
腐蚀,即“收缩”或“细化”二值图像中的对象。收缩的方式和程度由一个结构元素控制。数学上,A被B腐蚀,记为AB。换言之,A被B腐蚀是所有结构元素的原点位置的集合,其中平移的B与A的背景并不叠加。
2)膨胀
膨胀是在二值图像中“加长”或“变粗”的操作。这种特殊的方式和变粗的程度由一个称为结构元素的集合控制。结构元素通常用0和1的矩阵表示。数学上,膨胀定义为集合运算。A被B膨胀,记为A⊕B。总之,A被B膨胀是所有结构元素原点位置组成的集合,其中映射并平移后的B至少与A的某些部分重叠。这种在膨胀过程中对结构元素的平移类似于空间卷积。
3)开运算
在二值形态学图像处理中,除了腐蚀和膨胀这两种一次运算外,还有二次运算操作,开运算就是其中一种。用结构元B对图像A进行开运算表示为A。B,用集合运算记为(AB)⊕B。可以看出,开运算是先对图像进行腐蚀然后进行膨胀
4)闭运算
闭运算是二次运算操作的另一种,是一个先膨胀后腐蚀的过程。用结构元B对图像A进行闭运算表示为A·B,用集合运算记为(A⊕B)B。
6.模糊识别
模式识别也是数字图像处理的一个新兴的研究方向,目前应用广泛的文字识别(OCR)技术就是应用模式识别技术开发出来的,而模糊性也是人类思维和客观事物普遍存在的思想[13]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。