基于内容的图像检索采用的查询方式主要有三种:按例查询、浏览查询和草图查询。其中,最为典型的是按例查询方式。这三种查询方式虽然形式不同,但本质上都是将用户提交的查询图像转换为视觉特征向量,然后与目标图像库的特征向量进行相似性度量,最后返回与查询图像距离最近的一组结果。为了提高检索性能,在检索的过程中常常加入相关反馈机制,以优化排序结果。
相关反馈技术的起源可以追溯到20世纪60年代在文本检索领域的应用。到20世纪90年代初,相关反馈技术开始应用于图像检索。相关反馈是一种监督的自主学习方法,通过交互式的反馈优化用户和系统之间的信息传递(对检索结果的意见),将用户的专业领域知识和“主动性”通过反馈的方式传递给系统,从而在低层特征和高层概念之间建立关联。相关反馈检索的基本过程是:当用户提交一幅查询图像,检索系统将查询结果返回给用户,用户将对查询结果的满意程度反馈给计算机,使计算机能够在用户引导下,通过不断迭代调整系统参数对图像特征进行选取和优化,从而更好地模拟人对于图像的感知,以实现一定程度的语义层检索。
可见,相关反馈技术的本质是在图像检索中采用“user-in-the-loop”的方式,通过获取用户对于检索结果的实时反馈来不断改善检索性能的过程。由于有人的参与,在一定程度上弥补了图像的低层视觉特征在表达图像语义内容方面的不足。在图像检索相关反馈过程中最直接的用户参与方式是:在检索过程中,要求用户根据检索结果调节各项检索参数,但是这样会降低系统的智能性和适用性,对于普通用户而言尤为困难。常用的方式是在每一轮检索中,要求用户对当前检索结果的做出是正例(与查询图像相关)还是负例(与查询图像不相关)的判断,将此作为训练样本反馈给系统进行学习,指导系统进行下一轮检索,使得检索结果更符合用户的需要,从而提高检索精度。相关反馈的基本思想大致可以分为查询点移动和特征权重调整、分类问题、特征选择问题、学习问题、距离优化问题五类。
一、查询点移动和特征权重调整
早期的图像相关反馈检索研究主要采用了查询点移动(query-point movement,QPM)和特征权重调整(reweighting)技术。查询点移动的基本思想是根据用户的反馈调整查询点,使之逐步接近理想查询点,即接近反馈正例在特征空间中对应的点,同时远离反馈反例在特征空间对应的点,再用调整后的查询点开始下一轮检索,如Rocchio算法(Rocchio's formula)就是查询点移动的常用算法。特征权重调整则是通过调整特征及特征各维在查询时的权重来达到提高检索精度的目的。显然,不同的用户对于相同检索结果的反馈很可能是不同的。
二、分类问题
随着对相关反馈技术的深入研究,研究人员开始将相关反馈视为分类问题。基本思想是通过用户提供的样本集训练一个分类器,用于将数据集分为相关图像和不相关图像两类,最常用的分类器是支持向量机(SVM)和贝叶斯分类器(Bayesian classifier)。但是将相关反馈视为分类问题的局限性也很明显,因为在图像检索中,人们可能主观上很难把一幅图像归于某个特定类别,而且分类问题并不像检索那样考虑按照相似性对结果进行排序。(www.xing528.com)
三、特征选择问题
有些研究将相关反馈看作特征选择的问题。我们知道,图像内容描述是影响检索性能最关键的因素,但是增加的特征空间维数不仅会大大提高系统对计算和存储的要求,而且可能会由于休斯现象(Hughes phenomenon),使得检索系统的性能不升反降。将相关反馈视为特征选择问题的基本思想,正是根据特征的重要性更好地理解用户的查询意图,常用的方法包括统计模式识别技术或者人工神经网络等。事实上,权重调整方法也可以理解为一种显式的特征选择,因为经过几次迭代之后,大部分参数的权重会变得很低,对检索结果的影响可以忽略不计。
四、学习问题
一些研究将相关反馈视为学习问题,利用机器学习理论通过对用户反馈的样本集的学习,训练一个模型,用于指导下一轮的检索,如自组织映射网络模型(self-organizing maps,SOMs)和决策树学习(decision tree learning)等。与分类方法相比,学习方法能够解决相关图像和不相关图像高度不平衡的问题,但其局限在于用户的反馈通常只会包含少量的样本,而训练一个合适的模型需要大量的数据。针对未标注样本数据不足的问题,一种解决方案是采用基于主动学习(active learning)的相关反馈策略。
五、距离优化问题
有些研究将相关反馈视为距离优化问题,参见文献[17][18],但是这类方法同样存在样本数据不足的难题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。