首页 理论教育 信息推荐:检索与过滤

信息推荐:检索与过滤

时间:2023-10-31 理论教育 版权反馈
【摘要】:与信息检索不同,信息过滤对动态信息进行筛选,着重排除不希望得到的信息,带有即时性。虽然实现技术极其相似,但是信息检索和信息过滤所完成的任务根本不同。信息过滤信息过滤技术一般适合于用户需求相对不变而信息动态更新比较频繁的情况。它为用户的长期信息需求提供信息过滤服务。邮件系统信息过滤和新闻组信息服务是信息过滤技术的典型应用。例如,Amazon.com提供的Eyes推荐就是一个典型的基于关键词检索的信息过滤系统。

信息推荐:检索与过滤

推荐系统的关键技术主要包括信息检索(Information Retrieval,IR)技术和信息过滤(Information Filtering,IF)技术。与信息检索不同,信息过滤对动态信息进行筛选,着重排除不希望得到的信息,带有即时性。虽然实现技术极其相似,但是信息检索和信息过滤所完成的任务根本不同。

(1)信息检索

信息检索(IR)是指信息的收集、加工、存储、查找以及向用户提供所需信息的服务技术。它一般是指根据用户需求,从大规模的相对静止的数据库中检索用户需要的信息,主要满足用户瞬时的信息需求[1]。典型的例子就是根据关键字查询。传统的信息检索(狭义的信息检索)是指文献检索、数据检索,一般处理文献信息和数值信息,例如,在数字图书馆中进行检索时,用户提交所需要的书籍的关键字,数字图书馆中的索引擎根据预先建立好的内容索引,检索出用户需要的书籍或信息。而广义的信息检索不仅包括文献检索、数值检索,而且还包括事实检索和知识检索。检索信息的范围包括文本数据、数值数据、声音数据、图形、动画电视、图像数据等,实现图、文、声一体化对象管理。

信息检索的核心研究内容主要包括索引技术和查询技术。索引技术是对资源的具体内容进行分析,并将资源内容表示为计算机可以处理的数据结构的过程。查询技术主要是根据用户的需求,查询用户需要的信息资源。其研究范围主要包括查询语言的设计研究、可视化查询接口研究、用户请求与资源信息的匹配研究等。在许多情况下,索引技术与查询技术相互重叠,查询技术依赖于信息所采用的索引结构。

信息检索系统的界面主要包括两种形式。传统的信息检索主要使用关键词查询接口,用户根据自己的信息需求输入一个或多个关键词,信息检索系统根据用户提交的关键词进行查询,然后向用户返回检索结果。目前,越来越多的信息检索系统提供动态查询接口[2][3]。信息检索系统查询接口向用户提供一系列的信息主题供用户选择,然后根据用户的选择向用户提供下一层的信息主题,这样一直进行下去,直到用户检索到自己需要的信息为止。这种不断与用户进行交互的动态查询接口使得用户能更加容易地检索到所需信息。

信息检索技术是实现基于内容的推荐系统的关键技术之一。推荐系统根据用户需求,搜索产品类别数据库,然后返给用户其需要的信息。其搜索过程可以实时进行,也可以周期执行。同时,推荐系统提供的推荐界面既可以基于传统的关键字查询,也可以基于动态查询接口。前者如Amazon.com中的关键字查询,后者如drugstore.com中的Advisor推荐。

(2)信息过滤

信息过滤技术一般适合于用户需求相对不变而信息动态更新比较频繁的情况。信息过滤系统主要面对的是半结构化和非结构化的数据。它为用户的长期信息需求提供信息过滤服务。用户的兴趣模型可以采用用户特征(Profile)文件的形式表示。信息过滤系统将动态信息与用户特征进行匹配,根据匹配结果返给用户其所需要的信息。信息过滤与信息检索的主要区别包括[3][4]:(www.xing528.com)

①信息过滤面向用户长期的信息需求,而信息检索技术面向的是用户短期的、实时的信息查询。

②信息过滤使用特征文件表示用户的信息需求特点,而信息检索技术是用关键词表达用户的查询需求。

③信息过滤中用户需求相对不变,但用户访问的是动态数据流,是从动态数据流中选择数据;信息检索技术访问的是相对静止的数据,但用户需求却具有瞬时性。

邮件系统信息过滤和新闻组信息服务是信息过滤技术的典型应用。邮件系统信息过滤技术可以将特别紧急的消息从常规消息中分离出来,或是限制常规消息的显示,可以缓解用户受外来信息的干扰。在新闻组信息服务中,用户输入自己感兴趣的一组关键词,新闻组信息服务通过关键词建立用户档案。当新闻组中加入新信息时,信息过滤系统对新信息进行过滤,将满足用户需求的新信息反馈给用户。新闻组信息服务也可以分析用户订阅的信息,自动抽取关键词,建立用户档案,然后通过信息过滤系统将用户感兴趣的新信息反馈给用户。

信息过滤技术也是实现基于内容的推荐系统的关键技术之一。例如,Amazon.com提供的Eyes推荐就是一个典型的基于关键词检索的信息过滤系统。用户输入基于作者、标题、主题、ISBN和出版日期的关键词,Eyes推荐根据用户输入的关键词,建立用户档案。当产品目录中加入新书时,Eyes推荐根据用户输入的关键词和新书提供的相关信息,选择用户感兴趣的新书作为推荐结果,通过E-mail的方式推荐给用户。

信息过滤的一种扩展技术就是信息过滤智能代理(Agent)。该智能代理根据用户需求智能地搜索用户需要的信息,可以与推荐系统有效结合以产生高质量的推荐。在信息过滤智能代理中,用户根据自身需求输入关键词,建立初始化的用户档案。信息过滤智能代理根据用户对信息的反馈自动更新用户档案。用户反馈可以由用户直接提供,也可以根据用户的行为自动获取。信息过滤智能代理广泛应用于新闻组、电子邮件系统和互联网中。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈