本节主要介绍简单区域描述(包括分散度、伸长度、欧拉数、凹凸性、复杂性、距离、区域面积、区域周长、密集度、位置与方向等)和区域内部变换分析(包括统计矩、投影和截口)。
(一)简单区域描述
简单区域描述即区域内部空间域分析,是指不经过变换而直接在图像的空间域提取形状特征。主要包括分散度、伸长度、欧拉数、凹凸性、复杂性、距离、区域面积、区域周长和密集度等。
1.分散度
分散度能够反映形状的紧凑程度。设图像子集S,面积为A,即包含A个像素,周长为P,则S的分散度定义为
分散度符合人的认识,相同面积的物体,其周长越小,形状越紧凑。圆形的分散度是4π,是最紧凑的形状。其他任何形状的分散度均大于4π。几何形状越复杂,其分散度越大。例如,正方形的分散度为16,等边三角形的分散度为36/。
分散度具有二义性或多义性。如图4-14所示,两个区域具有同样的面积和周长,它们的分散度相同,但是具有不同的形状,所以要识别和区分它们,还必须借助其他的形状描述子。
图4-14 两个具有相同周长和面积的不同形状物体
2.伸长度
设图像子集S的面积为A,宽度为W,定义使S完全消失所需的最小收缩步数为S的伸长度,即
伸长度也符合人的视觉感知,面积一定的区域,其宽度越小,越细长;反之,则越粗短。
3.欧拉数
欧拉数是物体的个数和孔数之差。在一幅图像中,孔数为H,物体连接部分数为C,则欧拉数为
图像的欧拉数是图像的拓扑特性之一,它表明了图像的连通性,可用于目标的识别。例如,图4-15中所示的区域,因为“A”有1个连接部分和1个孔,而“B”有1个连接部分和2个孔,故其欧拉数分别等于0和-1。
图4-15 欧拉数分别为0和-1的图形
用线段表示的区域,也可根据欧拉数来描述。如图4-16所示的多边形网,将其内部区域分成面和孔。如果顶点数为W,边数为Q,面数为F,则其欧拉数为
图中的多边形网有7个顶点、11条边、2个面、1个连接区、3个孔,因此,由上式可得到E=7-11+2=-2。
一幅图像或一个区域中的连接成分数C和孔数H不会受图像的伸长、压缩、旋转、平移的影响。但如果区域撕裂或折叠时,C和H就会发生变化。可见,区域的拓扑性质对区域的全局描述是很有用的,而欧拉数是区域拓扑性的一个较好的描述。
图4-16 包含多角网络的区域
4.凹凸性
凹凸性是区域的基本特征之一。可通过以下方法判别区域的凹凸性:若区域内任意两个像素之间的连线穿过区域外的像素,则此区域为凹形;相反,如果连接区域内任意两个像素的线段不通过该区域以外的像素,则此区域是凸的。
一个凸状物体是没有凹处的,也不会有孔,而且是连通的。但要注意:在数字图像中的凸性物体,在数字化以前的模拟图像中可能有细小凹处,这些细小凹处往往会在取样时被漏掉。
为了应用图像子集的凹凸性分析它的形状特征,常常运用“凸闭包”的概念:即任何一个图形,把包含它的最小凸图形称为这个图形的凸闭包,如图4-17所示。
图4-17 区域的凹凸性
a)凹形 b)凸形 c)中凹形的凸闭包 d)凹形面积
凸图形的凸闭包就是它本身。从凸闭包除去原始图形的部分以后,所产生的图形的位置和形状可作为形状特征分析的重要线索。凹形面积可将凸封闭包减去凹形得到。
5.复杂性
人们对物体形状复杂性的判断不仅依赖于物体自身的许多特性,而且与观察环境、观察者的知识、习惯、经验等心理因素有关,具有一定的主观性。例如,电子工程师认为简单的电子线路图,非专业人士则可能会认为很复杂。因此,物体形状的复杂性是很难进行定义和定量测度的。判断形状的复杂性时,一般可从以下几个方面来考虑:
1)区域边界上曲率极大值越多(即角越多),其复杂性越高。
2)区域边界上的曲率变化越大,其复杂性越高。
3)要确定或描述物体形状所需的信息量越多,其形状越复杂。
例如,考虑一个单连通区域(即无孔,只有一个封闭边界)的形状复杂性,一种简单的方法就是将边界曲线上各点的曲率绝对值相加,和越大,则形状越复杂;另一种方法是计算曲率局部极大值的个数,并用它们的尖锐程度加权。另外,分散度和对称性也是物体复杂性分析的重要因素,描述对称物体比不对称物体所需的信息量少一倍。
形状复杂性可以用离散指数e来表示:
式中,L是该区域边界的周长;S是该区域的面积。该指数描述了区域单位面积的周长大小,e越大,表明单位面积的周长越大,即区域离散,为复杂形状;反之,则为简单形状。e值最小的区域为圆形。典型形状的e值为:圆形e=12.6;正方形e=16.0;正三角形e=20.8。此外,常用于判断形状复杂性的特征量还有区域的幅宽、占有率和直径等。
6.距离
距离在实际图像处理过程中往往作为一个特征量出现,因此对其精度的要求并不高。对于给定图像中的三点A、B和C,当函数D(A,B)满足以下条件时
则把D(A,B)叫作A和B的距离。其中式(4-58)的上式表示距离具有非负性,并且当A和B重合时,等号成立;式(4-58)的中式表示距离具有对称性;式(4-58)的下式是距离的三角不等式。
如图4-18所示,计算像素(i,j)和(h,k)之间的距离常采用以下三种方法:
欧几里得(欧氏)距离
4邻域距离(街区距离)
8邻域距离(棋盘距离)
这三种距离之间的关系是
图4-18 三种距离示意图
a)欧几里得距离 b)街区距离 c)棋盘距离
街区距离和棋盘距离都是欧式距离的一种近似。离开一个像素的等距离线,在欧氏距离中大致呈圆形,在棋盘距离中呈方形,在街区距离中呈倾斜45°的正方形,如图4-19所示。街区距离是图像中两点之间最短的4连通长度,而棋盘距离则是两点之间最短的8连通长度。此外,有时也采用把4邻域距离和8邻域距离组合起来得到的八角形距离,它的等距线呈八角形。
图4-19 离开一个像素的等距离线
a)欧几里得距离b)街区距离c)棋盘距离(www.xing528.com)
7.区域面积
区域面积的计算方法有两种:一种是像素计数面积,即统计区域边界内部(包括边界上)像素的数目。例如,图4-20中的区域面积为S=24。另外一种是用边界坐标计算面积,即对区域的封闭轮廓曲线进行积分,得到其所包围区域的面积。在x-y平面中的一条封闭曲线包围的面积,由其轮廓积分给定
离散形式为
如图4-21所示血管壁内膜轮廓曲线所包围的面积即为管腔的横截面积。对内膜轮廓点进行B样条曲线拟合,得到用参数曲线表示的轮廓线,然后对该曲线积分,就得到管腔的横截面积。
8.区域周长
区域的周长即区域的边界长度,可用相邻边界点之间的距离之和来表示。采用不同的距离公式,对于周长的计算有很多方法。常用的有两种:一种是采用欧氏距离,即在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素之间的距离为1,与倾斜方向上相邻边缘像素之间的距离为,那么周长就是这些像素间距离的总和。通过这种方法计算的周长与实际周长相符,因而计算精度比较高。另一种计算方法是采用8邻域距离,将边界像素的个数总和作为周长。此种方法简单方便,但其结果与实际周长之间有差异。
图4-20 区域面积计算示意图
图4-21 完成血管壁轮廓提取的一帧IVUS图像
9.密集度
度量圆形度最常用的是密集度C,用来描述目标形状接近圆形的程度,其定义为:
式中,S为区域面积,L为区域周长。C值的大小反映了被测量边界的复杂程度,越复杂的形状取值越小,C值越大,则区域越接近圆形。根据此标准,圆是最密集的图形。密集度还有另一意义:即周长给定后,密集度越高,所围面积越大。
10.位置与方向
位置即用物体的面积中心点作为物体的位置。面积中心就是单位面积质量恒定的相同形状图形的质心,即图4-22a中的O点。物体的位置坐标是
如图4-22b所示,若物体是细长的,则可以把其较长方向的轴作为物体的方向。
图4-22 物体的位置和方向示意图
a)位置 b)狭长物体的方向
(二)区域内部变换分析
区域内部变换分析是形状分析的经典方法,包括求区域的各阶统计矩、投影和截口等。
1.统计矩
具有两个变元的有界函数f(x,y)的p+q阶矩mpq定义为
式中,p,q∈{0,1,2,…},即p和q可取所有的非负整数值,因此产生一个矩的无限集,而且该集合完全可以确定函数f(x,y)本身。换句话说,函数与其矩集合有一一对应的关系:集合{mpq}对于函数f(x,y)是唯一的,也只有f(x,y)才具有该特定的矩集。
大小为n×m的数字图像f(i,j)的p+q阶矩为0阶矩只有一个
m00是图像中各像素灰度的总和,二值图像的m00则表示目标物的面积。1阶矩有两个,高阶矩则更多。用m00除所有的1阶矩和高阶矩可以使它们和物体的大小无关。
如果用m00来归一化1阶矩m10和m01,则得到目标物体的质心(即形心)坐标:
中心矩是以质心作为原点进行计算的:
假设R是用二值图像表示的物体,则R的第p+q阶中心矩为:
式中,(xc,yc)是物体的质心。中心矩具有位置无关性,利用中心矩可以提取区域的一些基本形状特征。利用式(4-71)可以计算出三阶以下的中心矩:
一阶矩与形状有关,二阶矩显示曲线围绕直线平均值的扩展程度,三阶矩则是关于平均值的对称性的测量。
物体的中心主轴方向角θ可以由下式得出:
为获得缩放无关的性质,可以对中心矩进行归一化操作,即把上述中心矩用零阶中心矩来归一化,叫作归一化中心矩,记作ηpq:
式中,γ=(p+q)/2+1;p+q=2,3,4,…。
相对于主轴计算并用面积归一化的中心矩,在物体放大、平移和旋转时保持不变。单纯的中心矩尽管可以表征平面物体的几何形状,但都不具有不变性,但可以由这些矩构造不变量。这种方法最初是由Ming-Kuei Hu在1962年提出的,他利用归一化二阶和三阶中心矩,导出7个具有变换、旋转和缩放无关性的矩:
不变矩描述分割出的区域时,具有对平移、旋转和缩放都不变的性质。图4-23给出一组由同一幅图像得到的不同变形,验证上述7个矩的不变性。
图4-23 由同一幅图像得到的不同变形
a)原始图像 b)将图a)旋转45°的结果; c)将图a)的尺度缩小一半的结果 d)图a)的镜面对称图像
不变矩是图像的统计特性,满足平移、伸缩、旋转的不变性,在图像识别领域得到了广泛的应用。不变矩具备了好的形状特征所应该具有的某些性质,但它们并不能够确保在任意特定的情况下都具有这些性质。因此,要区别相似形状的物体需要一个很大的特征集。这样所产生的高维分类器对噪声和类内变化十分敏感。
利用不变矩的目标识别算法可按以下步骤进行:
1)对初始目标图像和测试图像进行预处理,将目标从背景中分割出来,将灰度图像转换成二值化图像。
2)提取目标的边缘,并计算目标区域和边界的中心矩。
3)对上述两组中心矩进行归一化,在归一化的基础上计算出7个不矩(式(4-76)),共同组成目标图像和测试图像中目标的特征向量。
4)计算两个向量之间的欧氏距离D,即为目标图像和测试图像的归一化特征向量的欧氏距离。预先设定一个阈值L,以确定两者的相似度,如果D<L,则测试图像中的目标是要寻找的目标,反之则不是。
2.投影和截口
大小为n×n的图像f(i,j)在i轴上的投影为
在j轴上的投影为
式中,i=1,2,…,n。由以上两式所绘出的曲线都是离散曲线。这样就把二维图像的形状分析转化为对一维离散曲线的波形分析。固定i0,得到图像f(i,j)的过i0而平行于j轴的截口f(i0,j),j=1,2,…,n。固定j0,得到图像f(i,j)的过j0而平行于i轴的截口f(i,j0),i=1,2,…,n。图像f(i,j)的截口长度为
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。