Web是一个海量的多媒体资源库,互联网面向公众开放后十多年的时间里,几大搜索引擎造就了一个搜索时代,如:Yahoo,Google等,Google的搜索技术中包括一种称为PageRank的技术,用于对搜索结果中大量的网页进行排序,实现海量网页数据的有效检索。图10-1是一个百度搜索结果的示意图,其中每一条结果就表示一个网页的链接。
然而,这些商业搜索引擎主要是针对文本信息,进行关键字匹配和检索,或者是通过图像相关的文件名、标注文本等,进行相似度匹配,以提供图像检索服务。例如:图10-2所示为百度图像检索页面中,输入“北京奥运会”得到的检索结果。
图10-1 百度网页搜索示意图
(www.xing528.com)
图10-2 百度图像搜索示意图
许多检索技术将Internet看成是一个图,每个页面作为图中的节点,页面中的链接就是这个节点指向其他节点的有向边。并且,最小数据单元是Web页面,即:用户得到的结果是相关的Web页面,而不是页面中的多媒体数据,如:视频、图像、音频等。因此,这些成功的技术也就难以用于跨媒体检索。
本章将介绍一种Web环境中的跨媒体检索方法,以Web页面中不同类型的多媒体数据为最小数据单元,构建跨媒体关联图(Cross-media Correlation Graph,CMCG),多媒体数据就是图中的节点,用CMCG来描述多媒体数据间相关性的多方面知识,如:底层内容特征之间的统计关系、Web页面之间的链接关系以及用户交互行为中的先验知识等。更进一步地,还将介绍如何在CMCG的基础上,采用全局相关性推理技术挖掘潜在的跨媒体语义,从而充分地利用Web环境中的辅助特征。
此外,目前许多Web环境中的检索技术都涉及用户交互信息的有效利用问题。用户访问日志、相关反馈等都是用户交互的常用方式,通过对用户日志数据的挖掘,可以找到具体每个用户的兴趣偏好,从而提高查询效率,或者更准确地理解用户的查询意图,如:个性化推荐就是一种考虑到个人偏好的检索。本章也将介绍一些用户交互方法,用于更新跨媒体关联图,使得系统检索效率能够随着用户的使用而得到提高。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。