社交网络和电子商务的发展使得推荐系统的研究和应用越来越广泛。根据谷歌学术搜索关键字“recommender system”得到的统计结果如图10-1所示,可以直观地看出,从1992年至今,有关推荐系统相关的研究成果,以发表论文数目来说有显著增长。
图10-1 “推荐系统”论文数量
纵观推荐系统的研究发展进程,将推荐系统分为如下三个阶段:
阶段一:推荐系统形成初期阶段。这一时期属于面向系统的探索阶段,不仅有基于协同过滤的系统,还有基于知识的系统(比如FindMe系统),在这个阶段,推荐系统被发现具有可行性和有效性,激发了人们推动该领域在科研及商业实践方面的不断发展的积极性。这一时期有以下三个标志性意义的事件:
(1)协同过滤。1992年Xerox Palo Alto研究中心开发了实验系统Tapestry[3],该系统是基于当时相对新颖的利用其他用户显式反馈(评分和注释)的思想,帮助用户过滤邮件、解决邮件过载问题,基于当时相对新颖的利用其他用户显式反馈(评分和注释)的思想。该论文也是最早使用“协同过滤”(collaborative filtering, CF)一词的,自首次在文章中提出后被广泛引用。尽管Tapestry能够提供较好的推荐,但它有一个主要的缺陷:需要用户书写复杂的查询语句。
(2)自动推荐。1994年产生了第一个能够自动推荐的系统:GroupLens系统[4]。该系统也是为文本文档(Usenet新闻消息)过滤而开发的,和Tapestry不同之处在于,Tapestry专指一个点(比如一个网站内、一个系统内)的过滤机制,GroupLens既能跨网计算又能自动完成。(www.xing528.com)
(3)推荐系统。1997年Paul Resnick等人[5]首次提出“推荐系统”( recommender system, RS)一词,认为该词比“协同过滤”更合适来描述推荐技术。原因有二:第一,推荐人和被推荐者相互之间可能不知道对方;第二,推荐除了指出那些应该被过滤掉的,还可能建议特别感兴趣的项目。 自此,“推荐系统”一词被广泛引用,并且推荐系统开始成为一个重要的研究领域。
阶段二:推荐系统商业应用的出现。这一时期推荐系统快速商业化,效果显著。MIT的Pattie Maes研究组于1995年创立了Agents公司(后更名为Firefly Networks)。明尼苏达州的GroupLens研究组于1996年创立了NetPerceptions。这一时期工作主要解决在大大超越实验室规模的情况下运行带来的技术挑战,开发新算法以降低在线计算时间等。这一时期标志性事件是电子商务推荐系统。最著名的电子商务推荐系统是亚马逊公司,顾客选择一个感兴趣的商品后,页面下方就会出现“通常一起购买的商品”和“购买此商品的顾客同时购买”的商品列表。Linden等人(2003年)公布了在亚马逊中使用的基于物品内容的协同过滤方法,该方法能处理大规模的评分数据(当时有2900万客户和几百万的商品目录),并能产生质量良好的推荐,大大提高了亚马逊的营业额,据统计推荐系统的贡献率在20%和30%之间[6]。另一个成功的应用是Facebook的广告,系统根据个人资料、用户朋友感兴趣的广告等对个人提供广告推销。
阶段三:新型算法不断涌现阶段。2000年至今,随着应用的深入和各个学科研究人员的参与,推荐系统得到迅猛发展。来自数据挖掘、人工智能、信息检索、安全与隐私以及商业与营销等各个领域的研究,都为推荐系统提供了新的分析和方法。又因为可以获得海量数据,算法研究方面取得了很大进步,更是在2006年被北美最大的在线视频服务提供商Netflix的100万美元大奖推上了高峰。这一时期标志性事件有:
(1)推荐分类。2005年Gediminas Adomavicius等人的综述论文[1]将推荐系统分为三个主要类别:基于内容的、协同的和混合的推荐方法,并提出了未来可能的主要研究方向。到目前为止,这篇文章引用率高达5 181次。
(2) Netflix竞赛。2006年10月Netflix宣布了一项竞赛,任何人只要能够将它现有电影推荐算法Cinematch的预测准确度提高10%,就能获得100万美元的奖金。该比赛在学术界和工业界引起了较大的关注,参赛者提出了若干推荐算法,提高推荐准确度,降低了推荐系统的预测误差,极大地推动了推荐系统的发展。
(3)推荐系统大会RecSys。 2007年第一届ACM推荐系统大会(ACM Conference on Recommender Systems, RecSys)在美国举行。这是推荐系统领域的顶级会议,主要是提供一个重要的国际论坛来展示推荐系统在较广领域的新的研究成果、系统和方法。
迄今为止,推荐算法的准确度和有效性方面得到了诸多改进,极大完善了推荐效果并可满足更多的应用需求。然而越来越大的数据规模对推荐系统算法的研究提出了更高的要求。因此,相关研究还有大量工作要做。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。