随着计算机、网络和各种移动数字终端的广泛应用,数字图像在现代数字多媒体环境中获得了越来越多的应用。从计算机的发展史来看,计算机在20世纪80年代由传统黑白界面为主的DOS系统逐渐过渡到视窗类操作系统(以Windows、UNIX、Linux为主)。在视窗类系统环境下,计算所处理的数据也逐渐由文本过渡到图像、视频和动画等多媒体数据格式,后期随着网络应用的不断扩展,以图像和视频为主的数据格式逐渐成为计算机世界应用的主流。在多媒体应用越来越广泛的过程中,数字图像格式也经历了很大的革新和变迁,形成了种类繁多的数字图像格式。这些数字图像在存储格式、存储容量、色彩模式和压缩方式等方面千差万别,从而形成了现代数字世界纷繁复杂的图像应用模式。这些数字图像的应用在不同环境和背景下获得了较好的效果,也得到了广大用户的认可。但是在现代大数据环境下,种类繁多的数字图像格式已经在某些邻域中成为一种牵绊和掣肘(目前大数据处理中有相当一部分是关于图像数据归一化表示的)。在数字图像分割中,这些多种类、多形式和多模式的图像格式也产生了一定程度的影响,如不同格式图像色彩模式有差别、数据压缩模式不统一等。这些图像格式的差别也对图像分割形成了一定程度的挑战,因此在大部分图像分割算法中需要对图像首先进行一定程度的预处理。本节后续内容将首先介绍常用的各种图像格式,然后分别分析这些格式对图像分割质量的影响。
1)JPEG图像格式
JPEG是联合图像专家组的简称,是一个图像国际标准,它既是一种图像文件格式,也是一种压缩标准。由于这类图像的压缩率很高,所以它是目前应用最广泛的一种图像格式。相对于文本格式数据,图像的存储空间将急剧增长,如一张800×600分辨率的图像,在不经任何压缩的情况下,大概需要几兆的存储空间。因此JPEG图像通过编码技术的改进,理论上可以获得较大的压缩比例,但是为了实现显示效果与存储空间之间的平衡,压缩比例也要进行相应调整。
基于JPEG图像的高压缩比,在极限情况下,图像的显示质量会明显降低。而如果降低图像的压缩比例,则图像存储空间将相应增加。这些图像格式的特点,对图像分割也有一定的影响,一般情况下,图像分割算法主要以图像色彩信息为基础元素,但是不同的压缩比例将导致分割的基础数据存在较大差异。基础数据的多少也将直接影响分割算法的效率,基础数据较多时能够获得更好的分割效果,基础数据较少时可能会影响图像分割质量,尤其是压缩比例较高的部分,可能导致该部分图像边缘模糊,不利于分割的精确性。因此,基于JPEG图像格式,在进行图像分割之前,需要进行一定程度的预处理,包括图像压缩比例调整、通过图像数据插值等方式对原始图像进行图像增强、图像锐化等。
2)BMP图像格式
BMP是一种位图格式,是Windows系统中主流的应用格式。除图像深度信息可以进行取舍以外,它不经过任何压缩手段处理,因此相对于JPEG之类的压缩图像格式,其存储空间一般较大。BMP图像格式尽管需求的存储空间较大,但是这也是这种图像格式的优点,在图像分割过程中,可以最大化地利用该类型图像提供的基础数据。因此,这类图像格式对图像分割质量的影响主要在于图像分辨率的差别。
位图图像格式的一个重要挑战在于,如果该图像采用了调色板,调色板的颜色量将直接影响图像分割质量。一般情况下,调色板越丰富,分割过程中能够获取的基础元素将越多,而调色板色彩信息较少时,分割所需基础元素将相应变少,分割精度将受到一定影响。另外一个影响图像分割效率的因素在于,位图格式的数据量一般相对较大,在大数据环境下,批量分割或处理数据时,将耗费更多的时间。因此位图格式图像在图像分割时,可能需要经过图像格式转换或滤波等一系列预处理。
3)深度图像(RGB-D)图像格式
RGB-D是一种深度图像格式,它由常见的RGB三通道彩色图像和深度图(Depth Map)两部分构成,它是一种最新应用的图像格式。在三维图形图像处理中,深度图是一个与视点相关的立体图像表述模式,它可以提供统一场景的多角度、多视点显示效果,也可以反映不同视点的明暗效果。具体来说,深度信息反映的是每个像素从视点到物体的实际距离。通常RGB图像和Depth图像是配准的,因而像素点之间具有一对一的对应关系。
由于该类型图像提供了除红、绿、蓝三基色之外的深度信息,所以可以为图像分割提供更加丰富的基础和支撑元素,但是其存储量也会相应增加。目前深度图像格式主要是结合卷积神经网络应用到语义分割中。
4)GIF图像格式(www.xing528.com)
GIF是一种图像互换格式,是一种采用LZW算法的无损压缩格式。GIF格式最大的特点在于一个文件中可以存储多幅图像,因此该类型的图像可以产生一定程度的动画效果。尤其是在网页和一些即时通信软件中,该格式的应用较为广泛。但是这类图像最大的缺点在于它最多只能处理256种颜色,其颜色数量有限。
在图像分割中,目前主流标准数据集中较少采用这种图像格式。如果确有必要采用这种格式进行图像分割,本书建议的方法为对该类格式的图像进行格式转换,将其转换为图像分割中主流应用的JPEG或BMP格式。另外,由于该类型图像颜色数量较少,因此为了提高图像分割效果,需要对图像进行增强、锐化等其他图像处理手段进行预处理。
5)其他图像格式
在图像分割中常用的标准数据集中,大部分图像都是JPEG和BMP图像格式,在语义分割中较多应用的是深度图像。当然在大数据时代,任何一种数据格式都可能是潜在图像分割的数据源。除上述几种主要图像数据格式以外,经常应用的数据格式还有可移植性网络图像(Portable Network Graphics,PNG)、标签图像(Tagged Image File Format,Tiff)、高动态范围图像(High Dynamic Range Image,HDRI)、跨平台标准格式(Encapsulated PostScript)等。
综上所述,同一幅数字图像可以采用不同的图像格式进行存储和表示,但是不同图像表示格式之间在信息量、信息完整性、图像处理软件方面差别较大。因此在图像分割之前,需要对图像进行一定程度的预处理,根据图像格式的差别,一般的图像预处理手段包括:
(1)图像格式转换,这种方法通常将图像转换为JPEG或BMP格式。
(2)图像插值或增强,这种方法一般针对颜色数量较少或图像分辨率较小的情况,在这种情况下,可以通过邻域插值和图像增强算法提高图像信息量,以利于图像分割质量的提高。
(3)通过通用性图像处理程序屏蔽图像格式差别。在这种方法中,使用人员将主要精力放在图像分割算法的优化上,图像数据获取由通用性图像处理程序完成,如Matlab提供了较为丰富的图像处理函数,可以通过imread命令打开各种类型图像,这在一定程度上屏蔽了图像格式差别。
当然上述几种手段不可能解决所有的问题,但幸运的是,图像增强、图像锐化、图像融合等图像处理手段是一种有效的补充。在一些极端情况下,还可以专门设置相应的预处理程序或手段集中解决相关问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。