随着研究工作的深入,人们发现如果完全依赖于图像相似度计算,基于内容的图像检索效率会受到很大的限制,难以得到进一步提高。这主要是因为基于内容的检索方法是以图像的视觉特征为依据,通过统计分析、机器学习、人工智能等方法来估计图像在语义上的相似性,存在着“语义鸿沟”的难题。举例来说,黄色的太阳和黄色的鸡蛋在视觉特征上非常相似,但是两者却描述了完全不同的语义概念,这就是底层特征和高层语义之间的鸿沟。因此,基于内容的检索方法一直难以得到较高的准确率。
面对这一问题,研究人员尝试将人工干预融入基于内容的检索系统中,其中,最为成功的一项技术就是相关反馈。该技术最早被用于传统的基于文本的信息检索中,根据用户对检索结果的评价和反馈,系统自动地调整模型匹配参数,以及对用户初始查询的表达,优化查询结果,使之更加符合用户的查询需求。多媒体数据都可以表示成特征向量的形式,即:可以当做特征空间中的样本点,因此,采用向量模型在实现检索时,主要是寻找离查询条件向量最近的数据库样本点,这种向量模型下的相关反馈方法大致可以分成如下几类:
1.查询向量优化法
查询向量是指对用户输入的查询条件的一种向量表达形式。例如:在基于例子的CBIR系统中,用户提交一幅样例图像作为查询条件,系统找出与样例相似的图像返回给用户,在实现检索的时候,即将样例图像用查询向量表示,与数据库中的图像用相同的视觉属性和空间维数表示。
查询向量优化法的基本原理是:根据用户反馈中的相关图像和不相关图像信息,将查询向量的坐标移向相关图像所在区域,同时,远离不相关图像。从而,更新后的查询向量更能准确地表达用户的查询需求,相应地,检索结果通常也能达到更高的准确率。(www.xing528.com)
2.特征权重优化法
该方法的核心思想是调整特征表达和相似度计算模型中的特征权重。例如:假设图像数据都被表达成n维向量空间中的样本点,并且,在用户反馈过程中标注的所有相关图像都具有同一个特征,即:这些图像在向量空间中的某个维度k上的方差很大,则说明了相对于其他特征,维度k上的特征不具备可区分性,对图像检索来说无关紧要,用户的检索需求不侧重于这个特征的比较。因此,在这种情况下,可以降低将特征空间中维度k所对应特征的权重。
3.基于机器学习的方法
近年来,一些机器学习方法被融入相关反馈中来,并取得了较好的效果。例如:采用基于支持向量机(Support Vector Machine,SVM)的主动学习方法(Active Learning)选择最有价值的反馈图像,使用贝叶斯方法计算图像集合的概率分布,在基于直推式学习(Transductive Learning)的检索算法中,用长期和短期学习策略来挖掘潜在的多媒体语义,等等。这些反馈方法的使用,一定程度上提高了图像检索系统的效率。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。