随着互联网技术的应用普及和电子商务的迅猛发展,充斥在网络中的信息资源数量呈现指数增长的态势。海量的信息同时呈现在用户面前,使得用户感觉无所适从,很难从中找到自己真正感兴趣的资源,从而出现所谓的“信息过载”问题。基于“信息拉取”方式的传统搜索引擎没有考虑用户的特征,将所有用户等同处理,返回给用户相同的资源序列,而且反馈的信息量非常大,不能从根本上帮助用户解决“信息过载”问题。因此,如何根据每个用户的偏好需求从互联网海量信息中寻找满足用户需求的信息,进而采取主动“推送”模式传送给用户,已经成为信息服务领域亟待解决的问题。
信息推荐系统(Information Recommendation System)就是在这种背景下诞生的。它基于“信息推送”服务模式,能够在分析预测用户需求基础上主动推送其可能需要但又无法获取的有用信息,并通过研究用户行为、兴趣和环境等,为用户推荐更具针对性的信息,即实现信息的“按需定制服务”,因此是当前解决信息过载的非常有潜力的方法。信息推荐系统与以搜索引擎为代表的信息检索(Information Retrieval)系统最大的区别在于:①信息服务模式不同,信息推荐系统是基于“信息推送”服务模式,以用户为中心;而搜索引擎则基于“信息拉取”服务模式,以信息资源为中心。②工作机理不同,推荐系统不需要用户主动地对其感兴趣的信息资源进行描述,而是通过显式或隐式的方式来收集用户的历史行为信息(例如网站访问、购买行为、资源评分等),进而利用这些历史信息来构建用户的偏好模型,从而根据该模型寻找用户可能感兴趣的信息以进行推荐。③搜索引擎的信息搜索过程由用户主导,包括输入查询词和选择结果,如果结果不满意用户会修改查询再次搜索;而推荐是由系统引导用户的浏览顺序,引导用户发现需要的结果,高质量的推荐系统会使用户对该系统产生信任和依赖。因此,推荐系统不仅能为用户提供个性化的服务,而且能够与用户之间建立长期稳定的关系,提高用户忠诚度,防止用户流失。
一般来说,信息推荐问题可以简化为预测目标用户对未评分资源的评分情况。一旦系统可以基于目标用户已有评分信息来预测用户对未评分资源的评分情况,就可以向该用户推荐那些评分值较高的信息资源。通用的信息推荐系统模型主要包括三个组成要素:用户、推荐候选对象、推荐方法,如图1-2所示[18]。用户可以向推荐系统主动提供个人偏好信息或推荐请求,也可以不提供,而是由系统自动采集。推荐系统可以采用不同的推荐策略或算法来完成推荐,如利用采集到的用户个性化信息和项目数据进行计算来得到推荐结果,或者直接基于知识库中的数据来完成推荐。
图1-2 推荐系统通用模型
Admomavicius等指出[19],推荐问题可以形式化地描述为:设C表示推荐系统中所有用户(User)的集合,S表示推荐系统中所有信息资源(如商品,图书、电影、旅馆等)的集合,C和S集合的规模通常很大。设效用函数u:C×S→R,其中R为一给定评分区间的有序集合。可以使用该效用函数来衡量特定信息资源s∈S对特定用户c∈C的效用性。因此,信息推荐要研究的问题就是:对于系统的目标用户c∈C,选出特定信息资源信息资源s*∈S,使得该用户的效用函数u达到最大,即有:
在基于评分的信息推荐系统中,经常使用用户对信息资源的评分值来表示资源项目对用户的效用值,即评分值的大小反映了用户对该资源项的喜好程度[20]。例如,在一个评分值区间为[1,5]的推荐系统中,用户Tom对电影《泰坦尼克号》的评论值为5,而对《罗马假日》只评1分,则表示Tom非常喜欢《泰坦尼克号》这部电影,而不喜欢《罗马假日》。根据不同的应用场景,效用函数u可来源于用户的定制信息,如用户主动向系统提供自己的评分信息;也可以使用系统计算出来的评分预测值。对于用户集合C,可以用一个描述文件来定义C中的每个元素,该描述文件记录了用户的性别、年龄、职业、学历、收入等多项特征。类似地,信息资源项目集合S中的每个元素也可以用一个项目特征集合来表示。例如,在电影信息推荐系统中,S为一电影集合,每部电影可以用电影ID、电影类型、导演、主演、国家、上映时间等一系列特征来描述。(www.xing528.com)
用户和对象的度量与采用可以使用不同的属性和特征,这根据实际面对的问题不同而不同。推荐服务研究的中心问题是效用函数u的计算。在信息推荐系统中,效用函数u并没有在整个C×S空间上进行定义,而只是给出了其在该空间的某个子集上的定义。因此,信息推荐系统的核心任务就是把u扩展到整个C×S空间上。对于基于评分的信息推荐系统来说,效用函数u初始时只在那些已经拥有评分的“用户—项目”组上有定义。例如,在电影推荐系统(http://movielens.umn.edu)上,新用户注册时,需要提供其若干个已经看过的电影的评分值。例如,表1-1给出一个“用户—电影”评分矩阵,其中评分值位于区间[1,5]之间,“?”表示用户还未给相应的电影进行评分。因此,该电影推荐系统的任务是根据已评分的电影进行评分扩展,即根据用户已有的电影评分来预测用户未评分电影的评分值,最后根据预测结果为用户产生相应的推荐电影。
表1-1 电影推荐系统“用户—电影”评分矩阵
可以用来预测推荐系统中未评分资源项目评分值的方法有很多,各类推荐服务模型在评分矩阵扩展和评分预测方面采取了不同的策略和算法,设计了不同的效用函数,这些内容将在本书后面章节中逐一详细介绍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。