随着图像分割技术的应用越来越广泛,国内外学者提出了大量的相关方法[23-31]。在不同的综述文章中,学者提出了不同形式的分类方法。根据不同的分类标准,分类方法也多种多样[32-33]。综合近年来国内外图像分割相关研究成果,根据分类标准的差异,本书将图像分割方法总结为五种,如图1.2所示。根据待处理图像色彩类型的差异,分割方法可以分为灰度图像分割方法和彩色图像分割方法;根据分割依据的差异,分割方法可以分为基于阈值的图像分割、基于区域的图像分割和基于边缘的图像分割;根据用户是否参与分割过程,分割方法可以分为有监督图像分割方法和无监督图像分割方法;根据所使用理论的差异,可以分为基于图论的图像分割方法、基于能量泛函的图像分割方法和基于水平集的图像分割方法;根据操作空间差异,可以分为基于特征空间的图像分割方法和基于位置空间的图像分割方法。
图1.2 图像分割方法分类
(1)根据待分割图像的色彩类型,可分为灰度图像分割方法[34]和彩色图像分割方法[35-42]。尽管目前彩色图像占据主流的应用,但是在一些特定领域,如医学图像[43-47]、文本图像[48-52]、工业图像[53-56]等,仍然以灰度图像为主。尤其是医学图像处理领域,由于设备和历史原因,灰度图像分割已经在辅助医疗中得到了广泛应用[43]。在文本图像处理中,文字自动识别[48]、道路监控中的车牌识别[57-60]也是图像分割技术的重要应用领域,而且相关技术已经实用化。在工业图像中,商标识别[61]、商品分类[62]、商品生产的自动化[63]等领域也出现了相当数量的图像分割方法。在彩色分割方法中,由于数据量的增长和格式的差异,其精确分割仍然是一个难题。最近几年,广大学者也提出了大量的相关算法,如基于能量函数方法[64]、基于多目标优化方法[65]、基于联合分割方法[66]等。并且这些方法在目标识别、特征提取、图像分类、图像标注和语义搜索等方面获得了广泛应用。
(2)根据分割依据的差异可以分为基于阈值的图像分割方法[67]、基于边缘的图像分割方法[68]和基于区域的图像分割方法[69]。基于阈值方法的基本策略是以图像的直方图为基础获取一个或多个灰度阈值,根据这些阈值将整个图像的灰度等级(0~255)划分为多个连续的灰度区间,然后根据每个像素点的灰度等级划分到不同的区域(即区间)。因此,这类方法的重点在于按照某些准则来求解最佳灰度阈值。更为详细的,可以分为全局阈值分割技术[70]、局部阈值分割技术[71]、自适应阈值分割技术[72-73]和与聚类技术相结合的方法[74-75]等。由于分割的结果或者以区域表示,或者以边界来表示,所以可以分为基于区域的方法和基于边缘的方法。边缘被定义为图像中两个相邻区域的边界点所构成的连续像素点的集合,它反映了边界像素点的局部特性差异,呈现了其在颜色、亮度、纹理、特征等的突变。它体现了图像边缘灰度值的阶跃型或屋顶型变化,因此可以使用微分算子进行边缘检测,即基于偏微分方程的分割技术[76]。经典的边缘分割方法有Canny算子[77]、Snake模型[78]以及gPb算法[79]等。Canny算子和gPb算子在图像分割中容易出现非闭合的边缘,从而导致分割区域模糊。而Snake方法能够获得闭合的边缘分界线,但它仅适用于分割单个目标。鉴于此,基于区域的算法受到了研究者们的广泛关注,相继提出了大量分割算法,如基于水平集的分割方法[80]、基于图论的分割方法[81]等。此类算法按照某种相似性评价准则将图像分为不同的子区域,包括种子点生长法[82]、区域的分裂与合并法[83]和分水岭法[84]等。种子点生长法从一组具有代表性的种子点出发,以邻域像素点的相似度为基础进行贪吃方式的聚合,最后将特征相同的像素融合到种子点所代表的子区域中。该类方法的优劣取决于种子点的初始化精度和种子生长规则。区域分裂与合并法的基本策略是以随机的方式先将图像所有像素点划分到不同的子区域中,然后以某种相似性度量准则对随机分割出来的区域进行不断的分裂和不断的合并,当准则被最大化或最小化时分割完成。分水岭法是根据拓扑理论和方法形成的一种形态学方法,其基本策略是根据图像特征将其视为一种地质上拓扑变化的地貌,图像特征被抽象为该像素点在地貌拓扑变化中的海拔高度,根据地貌形成的领域内的局部极小值及其扩散形成的区域定义为集水盆,从而在边界处形成分水岭(即区域的边界)。分水岭法的最大缺点在于它对噪声过度敏感,微弱的噪声就会导致极其明显的过分割。
(3)根据在分割过程中用户是否需要进行交互干预,可分为有监督方法[85-86]和无监督方法[87-88]。无监督图像分割的计算复杂度一般较高,主要应用于前景和背景差异较为明显的图像,如医学图像、文本图像和工业图像等。而对于图像场景较为复杂,且前景与背景在亮度、颜色和纹理等特征方面差异较小的图像,如自然图像、遥感图像等,无监督图像分割方法往往分割效果一般或者需要迭代多次才能得到满意的效果,且处理复杂度较高。为了满足用户的特殊要求或在精确的目标分割中,近年来有监督分割技术也得到了广泛应用,如在医疗诊断中,医生可能需要不断变换方位和角度,查看不同的子区域,需要不断的用户参与来完成病变区域的查看和分析。近年来,在有监督和无监督方法之间,根据实际应用环境,还出现了一种半监督图像分割方法[89-90],这类方法兼具有监督和无监督的特点,在保证算法复杂度降低的同时,减少用户参数的数量和时间,提高用户体验满意度。(www.xing528.com)
(4)根据所使用理论的差异,可分为基于图论的分割[91-92]、基于能量泛函的分割[93-94]和基于智能优化的分割[95-98]。利用数据结构中的图论知识,基于图论的分割将图像中的像素点抽象为图的顶点,像素之间的特征相似度量抽象为图的边,其权值为像素的领域相关性。根据像素的空间分布情况,形成一个领域像素相连的无向图,无向图中的节点是图像中的像素点的集合,无向图中的边用来表示相邻像素之间的关系,边的权值代表了领域像素在亮度、颜色或纹理方面的相似度。最终图像分割过程被抽象为图的最小切割问题,以每次切割的子区域内部相似度最大和不同切割区域的相似度最小为依据,通过某些智能算法对图进行各种试探性划分,经过一定程度的迭代以后,根据切割像素点的位置标定分割区域。该类方法的最大缺陷在于图的最优化切割需要较高的时间开销,即分割复杂度较高,因而分割的质量直接受制于图的切割优化。
基于能量泛函的分割主要是指活动轮廓模型(Active Contour Model,ACM)和以ACM为基础的衍生算法。它本质上是一种边缘算法,通过定义某个能量泛函,在该函数最大或最小时保证活动轮廓的边界趋向于目标的边缘。ACM可以分成两类:参数活动轮廓模型(Parametric Active Contour Model,PACM)和几何活动轮廓模型(Geometric Active Contour Model,GACM)。PACM以Lagrange框架为基础,以参数化形式表示轮廓,通过参数的不断变化,轮廓将不断接近目标边缘。当参数达到最优时,区域分割也随即完成。最有代表性的PACM是由Kass等提出的Snake方法[99]。但其初始轮廓参数直接影响最终的分割结果,因而近年来使GACM获得了较多的关注,它采用几何度量参数构造轮廓曲线,因此在轮廓结构变换方面表现良好。尤其是水平集方法(Level Set Method,LSM)[100]的引入,使GACM获得了广泛应用,因此GACM也称为水平集方法。
基于智能优化的分割[95]是近几年较为常见的图像分割方法,类似于基于能量泛函的分割,基于智能优化的方法首先确定一个或多个优化目标函数,然后通过智能优化算法将这些目标函数最大化或者最小化,在目标函数达到最优的同时,图像也能完成最佳分割。这是本书的重点研究内容,基于智能优化的相关阈值化分割方法的详细分析和介绍将在第2章中给出。
(5)根据分割算法是否考虑像素点的空间位置信息,可分为基于特征信息(如亮度、颜色、纹理和梯度等)的图像分割[74-75,91-92]、基于位置空间的图像分割[93-94]和特征与位置空间相结合的方法[101]。基于特征信息的图像分割主要包括前文所述的阈值分割方法和聚类分割方法。其中阈值化方法简单、直接,但是扩展到多级阈值以后计算复杂度较高,而聚类图像分割算法非常类似于种子生长法,它通过邻域像素点的迭代聚合,逐步实现图像分割。但是聚类方法受初始聚类中心影响较大,且不断地迭代聚类也会极大地提高算法的时间开销。基于特征信息的图像分割方法能够获得较好的分割效果,但是它没有考虑像素点的空间位置分布,是一种空间无关性方法,而且这类方法通常会出现同一分割区域在位置空间上不连续的情况。而基于空间位置信息的算法,如ACM、LSM、基于图论的算法等由于充分利用了像素之间的邻域相关性,其分割结果在空间位置上密切相关,但其分割效率也相对较低。在融合空间位置信息的图像分割方法中,综合考虑图像特征及空间位置信息,通过不同方法的融合实现高效的图像分割,这也是本书的重点研究内容。在这类方法中,近几年出现了一种特殊的分割方法——超像素分割[102]。超像素方法将分割单元从单一像素过渡到一种高度相关的相邻像素组成的超像素。本质上说,超像素是一种过分割方法,其分割粒度较小。它主要应用在医学细胞之类的微小颗粒型图像中。
在以上众多的图像分割算法[32-102]中,按照不同的分类标准,可以进行不同的类型划分,既有针对特定领域的医学、文本、工业图像分割方法,又有以自然图像为重点的分割方法。在众多图像分割算法中,阈值化图像分割[67,70-73]作为一种最为直接和简单的方法,获得了越来越多的青睐。本书将以阈值化方法为基础,结合像素空间位置信息[93-94,101]和智能优化算法[95-98],实现高质量的自然图像分割。在此基础上,本书也将重点介绍一部分其他图像分割的主流算法和框架,以提高本书的覆盖面和完整性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。