Web信息检索技术优化

时间：2026-01-23 理论教育烨版权反馈

【摘要】：例如:图10-2所示为百度图像检索页面中，输入“北京奥运会”得到的检索结果。图10-1百度网页搜索示意图图10-2百度图像搜索示意图许多检索技术将Internet看成是一个图，每个页面作为图中的节点，页面中的链接就是这个节点指向其他节点的有向边。更进一步地，还将介绍如何在CMCG的基础上，采用全局相关性推理技术挖掘潜在的跨媒体语义，从而充分地利用Web环境中的辅助特征。此外，目前许多Web环境中的检索技术都涉及用户交互信息的有效利用问题。

Web是一个海量的多媒体资源库，互联网面向公众开放后十多年的时间里，几大搜索引擎造就了一个搜索时代，如:Yahoo，Google等，Google的搜索技术中包括一种称为PageRank的技术，用于对搜索结果中大量的网页进行排序，实现海量网页数据的有效检索。图10-1是一个百度搜索结果的示意图，其中每一条结果就表示一个网页的链接。

然而，这些商业搜索引擎主要是针对文本信息，进行关键字匹配和检索，或者是通过图像相关的文件名、标注文本等，进行相似度匹配，以提供图像检索服务。例如:图10-2所示为百度图像检索页面中，输入“北京奥运会”得到的检索结果。

图10-1　百度网页搜索示意图

(https://www.xing528.com)

图10-2　百度图像搜索示意图

许多检索技术将Internet看成是一个图，每个页面作为图中的节点，页面中的链接就是这个节点指向其他节点的有向边。并且，最小数据单元是Web页面，即:用户得到的结果是相关的Web页面，而不是页面中的多媒体数据，如:视频、图像、音频等。因此，这些成功的技术也就难以用于跨媒体检索。

本章将介绍一种Web环境中的跨媒体检索方法，以Web页面中不同类型的多媒体数据为最小数据单元，构建跨媒体关联图(Cross-media Correlation Graph，CMCG)，多媒体数据就是图中的节点，用CMCG来描述多媒体数据间相关性的多方面知识，如:底层内容特征之间的统计关系、Web页面之间的链接关系以及用户交互行为中的先验知识等。更进一步地，还将介绍如何在CMCG的基础上，采用全局相关性推理技术挖掘潜在的跨媒体语义，从而充分地利用Web环境中的辅助特征。

此外，目前许多Web环境中的检索技术都涉及用户交互信息的有效利用问题。用户访问日志、相关反馈等都是用户交互的常用方式，通过对用户日志数据的挖掘，可以找到具体每个用户的兴趣偏好，从而提高查询效率，或者更准确地理解用户的查询意图，如:个性化推荐就是一种考虑到个人偏好的检索。本章也将介绍一些用户交互方法，用于更新跨媒体关联图，使得系统检索效率能够随着用户的使用而得到提高。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

Web信息检索技术优化

相关推荐

Web信息检索技术优化

相关文章：

相关推荐