图像分割被定义为根据特定的特征将图像划分为若干个互不相交的、互不重叠的区域或图像块。每个区域或图像块能够表现和反映图像的某些目标或受众感兴趣特征。它是进一步进行图像分析和图像理解的关键步骤。数字图像处理技术是一个跨学科的领域。伴随着计算机技术和网络技术的不断发展,图像相关的处理、分析和理解逐渐形成了完整的学科体系,大量图像分割技术不断涌现,在整个计算机学科领域中,图像分割作为一种重要的图像处理手段,其出现时间及历史相对较短,但却受到了越来越多的学者和爱好者关注,其最基本的需求来自于多媒体(尤其是图像和视频)在现代网络及大数据环境下的广泛应用。在人类感知世界的过程中,听觉和视觉是两种最重要的感知手段,而相对于其他感知手段,视觉能够更加形象、直观地反映客观世界的情况和问题,因此数字图像在生理学、心理学、大数据科学及计算机科学等诸多领域获得了越来越多的应用,同时这些应用的实施,也倒逼了数字图像在处理、分析和理解方面的研究。
图像分割是计算机视觉领域的重要预处理手段和重要前提,由于缺乏对人脑及人类神经系统工作原理的充分认识,计算机视觉技术虽然能够较为完美地获取真实世界的影像,但是对于所获取图像的类人分析和理解仍然遇到了较大瓶颈。这些缺陷也同时制约了人工智能的发展和应用。因此为了进一步提高计算机视觉的人工智能应用,图像分割作为一种图像处理手段,与图像格式数字化、图像锐化、图像融合、图像去噪等手段构成了完整的图像处理框架,尤其是图像分割技术为图像特征提取、图像目标识别、图像语义理解、图像搜索、图像注释等图像分析和图像理解学科提供了坚实的理论支撑和基础。
但是图像分割领域的研究也面临许多重大考验和难题。首先,在计算机领域中广泛应用的数字图像本质上有别于现实场景中的模拟图像,数字图像是对自然场景的近似模拟,并不是完整、无遗漏的整体反应。尽管为了满足人类视觉需求产生了诸如bmp、jpeg、gif、高动态范围图像和深度图像等多种图像格式,但是它们只能反映自然图像的部分信息,这些信息不完整性缺陷限制了数字图像的分析和理解。其次,图像种类繁多,不同领域和不同应用目的需要不同的数字图像格式,这限制了数字图像的一致化表达。尽管在不同场景中开发了诸如HSV颜色模型、HSI颜色模型、RGB颜色模型、CMYK颜色模型、HSL颜色模型、HSB颜色模型、Ycc颜色模型、XYZ颜色模型、Lab颜色模型、YUV颜色模型等颜色模型,但是每种颜色模型各有自己的侧重点,在某些应用领域中需要多种颜色模式之间转换或者混合、融合应用,这也提高了图像分割算法的难度。最后,人类视觉理解多样性也对图像分割效果提出了重要挑战,目前图像分割质量评价方法主要有峰值信噪比(Peak Signal to Noise Ratio,PSNR)、特征相似性指数(Feature SIMilarity Index,FSIM)、结构相似性指数(Structural Similarity Index,SSIM)、均方误差(Mean-square Error,MSE)、边界位移误差(Boundary Displacement Error,BDE)、概率随机指数(Probability Rand Index,PRI)、全局一致性误差(Global Consistency Error,GCE)等,但是所有这些评价方法在结合人类视觉和心理学特性以后将变得不再完全有效。比如在人脸分割中,经典分割方法会将人的面部区域分割为额头、眉毛、眼睛、嘴、腮等多个区域,但是在某些场合下,人类可能更加关注的是人的皱纹、酒渣鼻、雀斑和痣等微小特征和细节,因此数字图像分割仍然面临重大挑战和难点,其研究意义重大。(www.xing528.com)
除上述问题以外,数字图像本身还存在曝光度不一致、光照角度和亮度不均匀、自然或人为噪声、图像各目标单元相互遮挡、图像目标处于阴影区域、图像污渍、图像缺损等现实问题。这些固有存在的图像问题也极大地限制了图像分割的效果。因此对于图像分割算法的研究不仅是一个重要的研究学科,并且具有重要的应用和实践价值。图像分割技术的进步将极大地提高现代网络及多媒体时代广大受众的体验感和满意度,具有广阔的应用前景和市场价值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。