首页 理论教育 图像索引技术的优化方法及其在CBIR系统中的应用

图像索引技术的优化方法及其在CBIR系统中的应用

时间:2023-07-08 理论教育 版权反馈
【摘要】:本小节将介绍几种常见的图像索引方法。因此需要对高维特征向量进行降维,以降低和消除高维图像特征间的相关性和冗余度,从而提高检索精确度和效率。由于CBIR系统中往往含有海量图像,单纯的线性搜索方法难以满足实时检索的需要,有必要在特征库中使用相似索引技术来建立特征索引结构,以支持对中、高维特征向量的基于相似性的查询。如何使图像的底层特征与语义特征更加相近是当前CBIR研究的重点。

图像索引技术的优化方法及其在CBIR系统中的应用

由于图像内容特征由多维特征向量构成,因此图像内容特征索引属于多(高)维索引范畴,该索引技术的历史可以追溯到20世纪70年代中期。本小节将介绍几种常见的图像索引方法。

1)高维图像索引

一般情况下,描述图像内容的特征集合可看作是高维空间中的一个向量,为了增加搜索精度,其维数可达到102,在特征向量空间维数较低的情况下,传统的基于树结构的多维检索技术可以用来解决相似性查询问题,它们包括R-树、B-树和M-树等。但是,大多数的多维索引结构在空间和时间复杂度上都对维数有着指数依赖关系,当向量空间维数比较大时,比如大于三维时,这些索引方法性能迅速下降,其性能甚至不如穷举搜索。因此需要对高维特征向量进行降维,以降低和消除高维图像特征间的相关性和冗余度,从而提高检索精确度效率。但降维技术只是在保证一定精度的基础去除了特征之间的相关性,盲目地无限地降维会造成特征信息丢失,所以降维后,图像的特征向量对于传统索引结构来说,维数仍然是很高的,那么就需要构建一种合适的高维索引算法来为特征向量建立索引。

传统的树形索引结构并非为CBIR而设计,这些索引结构没有设计非欧氏距离度量问题,而CBIR中许多相似度计算方法都不是基于欧氏距离的,如颜色直方图相交。在这方面,传统的模式识别领域中的聚类和神经网络方法提供了解决的希望。为了解决非欧氏距离度量的问题,人们提出了度量空间的索引结构,如M-Tree、Slim-Tree等。

为此,研究者们提出了高维索引技术,将CBIR转化为高维空间点集的最近邻搜索问题。由于CBIR系统中往往含有海量图像,单纯的线性搜索方法难以满足实时检索的需要,有必要在特征库中使用相似索引技术来建立特征索引结构,以支持对中、高维特征向量的基于相似性的查询。在特征匹配时,CBIR系统将计算出来的向量距离按由小到大的排序方法来决定返回的结果。高效的索引结构可以对用户的查询进行快速的过滤,并返回准确的结果,这一点对网络检索特别重要,因为网络检索要求尽量小的网络传输时间和较高的检索效率。结果的返回方式大致分成两类:k个最近邻查询和球形范围查询。前者返回与查询向量的距离最小的k个特征向量所对应的图像;后者则返回与查询向量的距离小于一个阈值的所有图像。

高维索引技术可以采用的方法有两种:①缩小每个数据特征的长度;②缩小需要访问的数据集。有三个研究领域对高维索引技术做出了贡献,分别是计算几何、数据库管理系统和模式识别。在模式识别领域广泛应用的聚类和神经网络技术也可以对高维特征数据进行索引。

缩小特征长度可以通过降维技术和向量近似(vector approximation,VA)的方法来实现。基于降维的索引方法首先对数据集进行降维处理,降维后的数据维度减少,然后再利用传统的多维索引对降维数据建立索引。基于向量近似的索引方法,用紧凑的近似向量表示原始数据,通过近似向量的过滤,只需访问少量原始向量就可以完成查询,提高了检索效率。

缩小需要访问的数据集可以通过限定语义范围和基于聚类的索引方法来实现。限定语义范围要求用户对数据库的语义标注信息有所了解。基于聚类的划分是纯粹的基于数据分布的划分方法,一个聚类中的数据向量可以存储在连续的磁盘空间,这无疑可以提高检索效率,但是所达到的检索准确率取决于聚类算法的性能。

2)基于感兴趣区域的图像检索

目前的检索算法大部分侧重于考虑图像的全局信息,用全局特征来检索图像,这种方法的优点是计算简单,对平移和旋转不敏感,在一定程度上符合部分用户的检索意图。然而很多时候用户并不关心图像全局相似与否,而更多关注的是图像中具有一定语义的感兴趣区域。此时由于全局特征无法描述图像内容在空间上的差异,所以基于全局特征的方法检索效率不高。

为了克服CBIR技术中低层视觉特征无法准确地描述高层语义的问题,近年来提出的基于区域的图像检索技术(region based image retrieve,RBIR)是一种行之有效的方法。RBIR主要是把图像分割为若干区域,然后提取区域的局部特征来描述和检索图像,这样做在一定程度上实现了物体层次的图像检索,改善了检索效率。

虽然基于区域的图像检索算法对某些图像有很好的检索效果,但是有时由于问题图像的不同区域所含的信息量是不同的,因此它们的重要程度也不同,若对这些区域用相同的方法去提取特征,最后检索结果会造成很大的误差。考虑到这个问题,研究者近几年又提出了基于感兴趣区域的图像检索方法。感兴趣区域(region of interest,ROI)是指图像中最能引起用户注意力和兴趣,最能表现图像内容的区域。基于感兴趣区域的图像描述和检索既利用了图像的局部特征,又消除了次要信息的干扰,从而更准确和有效地进行CBIR的应用。(www.xing528.com)

如何使图像的底层特征与语义特征更加相近是当前CBIR研究的重点。基于区域的图像检索先采用图像分割的方法,用分割后的区域特征来描述图像,增强了系统的对象描述性和对用户要求的感知能力。但是,由于计算机分割的非主观性,分割后的区域不可能形成一个主观意义上的目标对象。它只能是以客观上的某种算法形成的物理区域。那么如何获得用户感兴趣的区域就成了基于区域检索的重点。

图像检索系统的设计应该以用户为核心,以捕捉用户感兴趣的信息为前提条件。但目前的图像分割技术还不能达到准确划分具有一定语义信息的数据块,更不用说能灵活地定位用户关注的信息块。因此必须在原有检索系统构成的基础上增加选择区域这个与用户交互的方式,从而为后续的检索提供可靠且准确的信息基础。一旦获取了能准确表达用户检索意图的图像区域,就能够提取出最能反映该区域实质的特征,有了反映图像本质的特征就可以采取扫描的匹配方法进行检索。

还有学者将计算机视觉中的兴趣点匹配技术应用到图像检索中,通过兴趣点的检测对图像的视觉特征变化大的区域进行定位,对兴趣点周围的局部区域进行特征提取,最后进行相似度量。通过兴趣点的集合来对对象特征进行描述,使得人们向面向语义对象的检索更近了一步,而且对图像的几何变换具有很强的鲁棒性,不需要对图像进行分割。兴趣点检测的目的是要提取图像中最具有代表性的点,宏观上把这些兴趣点组合起来就是图像中的感兴趣区域,由于这些点蕴含丰富的图像信息,使用它们并选用适当的局部特征描述子就能近似描述整幅图像的特征,从而减少了特征提取的复杂度。

3)多特征综合检索

基于内容的多特征综合检索是指在图像的单一特征的基础上,融合图像的多种特征进行综合检索。颜色、纹理、形状和对象的空间关系等基本视觉特征描述的是图像的某一方面的属性,都有其自身的特点和适用范围。在实际的检索中,仅依赖单一特征进行检索,效果往往不够理想。所以很多CBIR系统为了达到不同特征优势互补的效果,常常综合使用多种特征进行检索,称为多特征综合检索。

多特征综合检索可将不同特征两两结合,也可将两个以上特征结合。对不同特征的这种结合可在两个层次进行:①在检索中同时使用几种特征,即综合考虑几种特征共同进行检索;②综合考虑各特征的特点,设计新特征,实现更深层次的结合。例如结合颜色特征和空间关系的特点可构成基于颜色布局的图像检索,而色彩相关直方图则可看作是颜色特征与纹理特征结合构成的特征。

多特征综合检索主要涉及两个问题:一是某些特征向量的各分量物理意义不同,取值范围不同,因此相似距离的可比性很差,在以欧氏距离作为度量依据时,会产生很大的偏差。在匹配之前需要对各个分量进行归一化,称为特征向量的内部归一化。二是不同图像特征的分量在量值和意义上差别很大,在进行综合检索时,需要对不同特征向量进行归一化处理,称为外部归一化。

特征向量内部归一化的目的在于使特征向量内部各分量在相似度量时具有相同的地位,或有意使某一特征在综合特征中更加突出。外部归一化处理能保证不同的图像特征,在应用不同的算法时在加权中处于平等的地位,保证不同的特征向量在进行检索时具有相同的作用,从而有利于提高图像检索的准确率。通常采用高斯归一化方法并通过线性变换来完成。

对各种特征进行归一化处理后,根据不同的图像类型和用户不同的检索需要,对不同特征分别给予不同的权值,便可以进行图像检索。但是只有那些具有一定的相关领域知识的人才能准确地确定各特征的权值进而有效地实施图像检索,因此该方法并不具有通用性。而结合相关反馈原理是一种有效的尝试,即利用相关反馈,通过人机交互动态统计结果,不断调整图像组合特征的归一化权值系数,从而逐步达到精确检索的目的。

在实际应用中,综合特征检索有许多优点:①可以达到不同特征的优势互补的效果。例如,在颜色特征的基础上加上空间关系特征,能较好地表达景物的结构而且相当直观。②可以提高检索的灵活性和系统的性能,满足实际应用的需求。例如将形状特征与纹理特征结合,可用于对光片图像中具有特定纹理的区域的检测,以帮助发现可能的组织病变区域。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈