推荐系统一方面能够帮助用户发现他们潜在感兴趣的项目,另一方面能够帮助项目提供者将项目投放给对它感兴趣的用户。推荐系统能够对公司或业务产生增值效应,给用户带来更好的体验。为了让读者更灵活地掌握推荐系统,用于推荐系统应用实现,本章没有专门介绍某一个推荐算法,而是给出了推荐系统发展的三个阶段以及每个阶段的标志性事件,对推荐系统进行了分类,并分析比较了每种推荐算法的优缺点,然后总结了已有的推荐系统评价指标。
最后,需要指出的是,面向大数据的推荐系统研究是当前的热点方向,但也存在挑战:
(1)数据量巨大加剧了数据稀疏性问题和长尾(long tail)问题。在推荐系统中,可获得的已打分数目通常远小于需要预测的打分数目,如常用的数据集都非常稀疏,当评分矩阵达到某种程度之后,相比标准的CF技术,推荐质量会有所下降,而且距离关系的计算代价很高,很难实际应用到大规模评分数据上。长尾是指那些原来不受到重视的销量小但种类多的产品或服务,由于总量巨大,累积起来的总收益超过主流产品的现象。大数据背景下数据稀疏性和长尾问题是一个有趣并将得到持续研究的问题。
(2)推荐系统可使用的数据复杂繁多,如社交网络里面的信息、地点位置信息以及其他上下文感知信息都考虑进来,不但数据量增加,计算复杂度亦会成倍增加。(www.xing528.com)
(3)推荐系统属于应用型的研究方向,为此要分析推荐系统的商业价值及其对用户决策和购买行为的影响。对推荐系统的评价要考虑开发面向经济的衡量指标来捕获推荐的业务价值,如投资回报率等。由于目前还没有统一的评估标准,研究人员倾向于选择对自己算法有利的评价指标,而忽略其他评价指标。因此,建立一个客观合理的评价指标体系有利于推荐系统的研究与发展。
(4)推荐系统对时效性要求较高,想真正捕获最优的推荐机会,时效性非常重要。如何将海量的用户数据应用到实时的用户交互中以提高用户体验,导致了推荐系统可扩展性(scalability)问题。 目前很多推荐模型虽然可以获得很好的预测精度,但因它们有较高的计算复杂度,很难应用于实际的大规模推荐问题,因此未来推荐算法的可扩展性问题仍是一个值得研究的方向。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。