由于流形学习的过程挖掘了多媒体数据集内部的潜在关系,因此,在降维后的子空间中,多媒体数据间的距离更能够在一定程度上体现出语义上的相似关系。一些多媒体检索算法将流形学习得到的子空间称为是语义子空间。类似地,上一节中得到的低维子空间也可以称为是一个语义子空间,跨媒体检索可以根据子空间中的距离度量来实现,距离与相似度成反比。
为了进一步提高检索效率,缩小语义鸿沟,可以采用短期修正和长期修正策略。首先,用户提交查询例子,系统通过跨媒体搜索引擎返回不同类型的相似对象;然后,用户对返回的结果进行评价,标注反馈正例和反馈负例。短期修正和长期修正策略都是用来学习用户的反馈信息,从中找到有用的数据以优化跨媒体搜索算法。
短期修正策略作用于当前的查询例子产生的查询过程,而对于其他查询例子的检索过程不产生影响,因此对查询效率的优化只是短期的,随着查询的结束,优化作用也就结束了;而长期修正则是作用于测地线距离矩阵,对矩阵进行更新和优化,因此,是对整个多媒体数据集产生全局的和长期的作用。这两种策略具体描述如下:
1.短期修正
多媒体数据具有语义丰富的特点,因此,用户提交的查询例子很可能具有多义性,不一定能够准确地反映用户的查询意图;短期修正策略依赖于查询例子,可以调整查询向量在语义子空间中的坐标,使之更加接近用户的真实查询意图,从而修正查询结果。这种方法需要分别考虑以下两种情况:
(1)设查询例子为R,反馈正例为P,如果R和P是相同类型的多媒体数据,则将R在语义子空间中对应的向量向P的中心移动,使之更加接近反馈正例;如果R和P是不同类型的多媒体数据,则进行查询扩展,以P为查询例子检索与P相同类型的相似对象,作为新一轮的结果返回。(www.xing528.com)
(2)设反馈负例为N,对N采取不同的修正策略。对于∀ni∈N,找到与它相同类型的K近邻集合Ci,将ni和Ci都向远离R的方向移动。
2.长期修正
独立于查询例子。长期修正策略是为了以增量学习的方式将用户交互过程中学习得到的知识融入系统中,具体地说,就是保存到测地线距离矩阵中,使得本次查询中学习得到的先验知识,在下次查询过程中同样可以使用。长期修正策略也分为如下两种情况:
(1)缩小反馈正例P和查询例子R之间的距离,即乘以一个小于1的常参量A*(x,y)=αA*(x,y),(x,y∈P∪R,α<1),其中A*为测地线距离矩阵;
(2)类似的,加大反馈正例P和反馈负例N之间的距离,即乘以一个大于1的常参量A*(x,y)=βA*(x,y),(x∈P∪R,y∈N,β>1),当测地线距离矩阵A*更新到一定程度时,需要重新计算子空间坐标,即:以更新后的矩阵A*作为MDS算法的输入,得到的输出就是新的子空间坐标。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。