从研究范围和特征种类的角度,人工设计视觉特征可以分为全局特征、区域特征和局部特征。图像检索研究初期,通常将图像作为一个整体进行分析,如从统计的角度分析图像的全局颜色分布或者纹理分布。全局特征简单直观,具有较强鲁棒性,缺点是难以和图像的空间特征相关联,且描述图像细节信息的能力不足,这使得单纯基于全局特征的图像检索系统的精度难以满足实际应用需求。
根据人的视觉选择特性,人们通常更关注图像中的某些区域而非整体,采用感兴趣区域的特征描述图像内容,如区域内颜色或纹理分布以及区域轮廓特征等,可以有效降低图像的背景对于图像理解的干扰;或者将图像根据纹理等特征分割为多个同质区域,用各区域及区域间空间关系描述图像内容,增强对图像空间信息表达的能力。基于区域的图像检索(region-based image retrieval,RBIR)就是将图像中的区域作为研究对象而实现的检索。
需要说明的是,通过超像素方法或者纹理分割生成的区域,往往是不规则的(即任意形状区域),提取任意形状区域的特征可以采用直接法或填充法。直接法不对不规则区域做任何变换,而是将其分割为规则小像素区域,通过计算所有小像素区域的统计特征(如纹理特征平均值)来描述整个不规则区域纹理特征。填充法首先将不规则区域通过零填充或者有效值(如像素镜像值)填充“拉伸”为规则区域,然后采用常规的特征提取算法获取不规则区域的特征。
随着可获取图像分辨率的提高,图像内容越来越丰富,可以观察到的细节信息也更加丰富。局部特征描述子提供了一种描述图像上以兴趣点为中心的显著块(salient patches)特征的手段,满足不变性。局部特征应用于图像检索时,比全局特征更适合描述目标及其相互之间的关系,典型的局部特征描述子包括尺度不变特征描述子(scale-invariant feature transform,SIFT)及其改进算法、方向梯度直方图(histogram of oriented gradient,HOG)、局部二值模式(local binary patterns,LBP)等。然而,局部特征向量往往具有很高的维度,在实际应用中,往往通过特征聚合方法将低层视觉特征转化为表达力更强的中层特征,如视觉词袋(bag of visual words,BoVW)、空间金字塔匹配(spatial pyramid matching,SPM)、局部聚集向量(vector of locally aggregated descriptors,VLAD)以及改进的费舍尔向量(improved fisher vectors,IFV)等,以解决图像检索中局部特征向量的高维度问题。(www.xing528.com)
需要说明的是,图像的全局特征、区域特征和局部特征存在一定程度的重合,一些方法既可以描述图像全局和区域特征,也可以描述图像的局部特征,比如傅里叶变换和局部二值模式等。
随着计算机视觉技术及相关领域技术的发展,人们意识到大多数情况下低层和中层视觉特征的相似性与人眼视觉特性之间存在弱相关性,基于低层和中层视觉特征的相似性实现的图像检索,忽视了图像的语义相似性,而图像的语义概念能够更好地表达人眼对图像的理解,图像高层语义特征能够更好地表达图像的场景语义信息,实现语义层检索。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。