基于熵的阈值分割方法的基本思想是利用图像的灰度分布密度函数定义图像的信息熵,根据假设的不同或视角的不同提出不同的熵准则,最后通过优化该准则得到阈值。
(一)图像的一维熵和二维熵
图像的熵(Entropy)是一种特征的统计形式,它反映了图像中平均信息量的多少。图像的一维熵表示图像中灰度分布的聚集特征所包含的信息量,令Pi表示图像中灰度值为i的像素所占的比例,则定义灰度图像的一元灰度熵为:
图像的一维熵可以表示图像灰度分布的聚集特征,却不能反映图像灰度分布的空间特征。为了表征这种空间特征,可在一维熵的基础上引入能够反映灰度分布空间特征的特征量来组成图像的二维熵。
设图像中某像素的灰度值为i,以该像素为中心的邻域灰度均值为j,i与j组成特征二元组,记为(i,j)(0≤i,j≤255)。这样,原始图像中的每一个像素都对应于一个点灰度-区域灰度均值对。设f(i,j)为图像中特征二元组(i,j)出现的频数,Pij为点灰度-区域灰度均值对(i,j)发生的概率
式中,图像的大小为N×N;Pij可反映某像素的灰度值与其周围像素的灰度分布的综合特征。定义离散图像的二维熵为
依此构造的图像二维熵可以在反映图像包含信息量的前提下,突出反映图像中像素位置的灰度信息和邻域内灰度分布的综合特征。
熵的大小和图像的清晰程度没有绝对的关系,它只是反映图像的信息量大小,也就是画面上的复杂程度。它是一个整体量,不代表局部,不能说图像越清晰熵越小或越大,比如,一幅噪声很多的图像熵往往较大。
(二)一维最大熵分割方法
20世纪80年代以来,许多学者将Shannon信息熵的概念应用于图像阈值化,其基本思想都是利用图像的灰度分布密度函数定义图像的信息熵,根据假设的不同或视角的不同提出不同的熵准则,最后通过优化该准则得到阈值。1980年,Pun提出了最大后验熵上限法,通过使后验熵的上限最大来确定阈值。1985年,Kapur等提出了一维最大熵阈值法,假定目标和背景服从两个不同的概率分布,此方法又称为KSW熵方法。具体思路如下:
假设采用灰度级T作为阈值分割图像,灰度值大于T的像素认为是属于背景区域b的,灰度值小于T的像素属于目标区域O。对于这两个区域,分别计算每一个灰度级i出现的频率,即灰度值为i的像素数。将这个频率定义为灰度级的分布概率p(i),那么目标区域和背景区域的灰度分布概率Po和pb分别定义为
这里认为灰度图像的灰度级是0~255。目标和背景区域的一维熵为
那么整幅图像的一维熵为
选取使H(T)最大的T值作为分割图像的阈值。
(三)二维最大熵分割方法
一维最大熵分割方法的缺点是仅考虑了像素的灰度信息,没有考虑其空间信息,所以当图像的信噪比降低时分割效果不理想。为此,可以结合图像的区域信息,区域灰度特征包含了图像的部分空间信息,且对噪声的敏感程度要低于点灰度特征。综合利用这两个特征就产生了二维最大熵阈值分割方法,这里介绍两种方法。
1.边缘分割
根据灰度级-邻域灰度偏差形成的二维灰度直方图选取阈值。首先对于原始图像中的每个像素,取以其为中心的n×n邻域窗口:
式中,I(x,y)是像素(x,y)的灰度值,n是奇数,为了简单起见,可取4邻域或8邻域。将当前像素及窗口内的像素看作一个区域。令
式中
是区域内像素灰度的平均值。函数g(x,y)表示区域内像素的灰度值与平均灰度值的标准偏差。这样,原始图像中的每个像素都对应一个点灰度-区域灰度偏差对。以I(x,y)和g(x,y)为两个坐标轴就得到了二维灰度直方图。
二维直方图的平面图如图3-21所示,横轴表示区域内各像素的灰度值,纵轴表示区域内像素灰度的标准偏差。假设原始图像中有L个灰度级,那么图中共有L2/2个点。令rij表示图中灰度值为i,邻域灰度偏差为j的点,假设存在一个最优阈值向量(T,S),它可将二维灰度直方图分割成A和B两部分,其中A中的像素可能是边缘点(邻域灰度偏差较大),B中的像素可能是非边缘点(邻域灰度偏差较小)。直线TS的方程为
图3-21 二维灰度直方图(灰度-邻域平均灰度)
选择(T,S)使A区和B区的熵都最大。因为A区和B区的像素是独立分布的,所以A区和B区中像素出现的概率可表示为(www.xing528.com)
A区和B区的熵可用下式计算
那么阈值向量(T,S)可由下式得到
2.区域分割
根据灰度级-局域平均灰度级形成的二维灰度直方图进行阈值选取。首先以原始灰度图像(L个灰度级)中的每个像素及其邻域像素构成一个区域,该像素的灰度值i和邻域的灰度均值j构成一个二维向量(i,j)。这样,原始图像中的每个像素都对应于一个点灰度-区域灰度均值对,此数据对存在L×L种可能的取值。设nij为图像中灰度为i、其区域灰度均值为j的像素数,pij为点灰度-区域灰度均值对(i,j)发生的概率
式中,图像的大小为N×N,则{pij,i,j=0,1,…L-1}就构成了该图像关于点灰度-区域均值的二维直方图。
图3-22a为用灰度图像表示的二维灰度直方图,可以看出,点灰度-区域灰度均值对的概率高峰主要分布在平面的对角线附近,并且在总体上呈现出双峰状态。这是由于图像的所有像素中,目标点和背景点所占比例最大,而目标区域和背景区域内部的像素灰度级比较均匀,点灰度及其区域灰度均值相差不大,所以都集中在对角线附近,两个峰分别对应于目标和背景。远离平面对角线的坐标处,峰的高度急剧下降,这部分反映图像中的噪声点、边缘点和杂散点。
二维灰度直方图的平面图如图3-22b所示,沿对角线分布的A区和B区像素的灰度值与邻域平均灰度值接近,说明一致性和相关性较强,应该属于目标或背景区域;远离对角线的C区和D区一致性和相关性较弱,应为噪声或边界部分。所以应该对A区和B区用灰度——区域灰度平均值二维最大熵法确定阈值,使分割的目标和背景的信息量最大,即目标类和背景类的后验熵最大。设A区和B区具有不同的概率分布,用A区和B区的后验概率对各区域的概率pij进行归一化处理,使分区熵之间具有可加性。如果阈值设在(s,t),则
图3-22 二维灰度直方图及其平面图
a)二维灰度直方图 b)二维灰度直方图的平面图
定义离散二维熵为
则A区和B区的二维熵分别为
同理
式中
由于C区和D区包含关于噪声和边缘的信息,概率较小,所以将其忽略不计,即假设C区和D区的pij=0。可以得到
式中
则
熵的判别函数定义为
显然,如果不忽略对远离对角线的C区和D区的概率,则熵的判别函数为
选取的最佳阈值向量满足
采用一维和二维最大熵法对标准Lena图像的分割结果如图3-23所示,显然与图3-23b相比,图3-23C的二维最大熵分割结果图中保留了更多的图像细节。
图3-23 采用一维和二维最大熵法对标准lena图像的分割结果
a)原始图像 b)一维最大熵二值图像 c)二维最大熵二值图像
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。