个性化推荐的研究起步较早,相关成果也比较多,从知网搜索与“个性化推荐”相关的文献,可以搜索到8091篇,图8-1为相关文献的发文量与时间分布关系图。从图中可以看出,对于个性化推荐的研究虽然是一个老问题,但是其热度并没有降低,呈明显上升趋势。分析相关度排序前20名的文献,可以发现当前对个性化推荐的研究主要是“老方法新应用”,即将传统的个性化推荐技术应用到新的场景,这些场景主要是和计算机网络相关的领域,包括电商平台、社交媒体、智慧图书馆等。
目前,常用的推荐技术主要有基于内容的推荐(C-Recommendation)、协同过滤技术(Collaborative Filtering,CF)和混合推荐(H-Recommendation)三种。
基于内容的推荐通过概率统计、机器学习和人工智能等相关技术对信息进行过滤,然后将信息和用户兴趣分别表示成向量的形式,通过向量的相似度计算进行信息和用户兴趣的匹配,进而实现对用户的个性化推荐[153]。基于内容的推荐系统适用于易于提取内容的推荐,但对于难以提取内容的商品(如电影、音乐等),常得不到令人满意的推荐效果[154]。
图8-1 “个性化推荐”相关文献统计图(www.xing528.com)
协同过滤推荐研究[155]起步于20世纪90年代开始,该推荐技术是推荐策略中比较成功的技术之一,它的出现有效地促进了推荐系统相关研究的发展。协同过滤技术能够为用户挖掘新的资源对象,对于某些内容特征难以提取的对象也能产生良好的推荐效果,解决了基于内容推荐存在的问题。但是,协同过滤技术存在打分稀疏性、冷启动和可扩展性差等问题。这是因为通常它所需的信息量很大,一般情况下,很难获得所有对象的所有相关信息,并且获得具有代表性的数据的难度也比较大,用户或项目的独特属性也很难被发现。
在个性化推荐研究中,上述两种为主流的推荐算法,实际上推荐算法还包括基于人口的统计学推荐、基于规则的推荐算法[156],相关内容本章后续内容将会介绍。
当面对不同的条件时,基于内容的推荐、协同过滤推荐、基于人口统计学的推荐和基于规则的推荐算法都不可避免地面临不同的问题。为了得到更好的推荐性能,许多研究人员已考虑将不同的推荐算法结合起来形成混合推荐算法。例如,吴航[157]提出了融合用户信任和标签的协同过滤推荐算法,该方法较好地解决了协同过滤推荐算法的数据稀疏和冷启动问题,并实验验证了其推荐性能。一般情况下,采用混合推荐技术的系统可以实现比独立推荐系统更高的准确性。所以目前如何有效地结合各种推荐技术是当前学者们的主要研究方向,这也是本章研究内容的出发点。
上述研究成果并没有涉及热点话题推荐,当前对热点话题推荐的相关研究较少,从知网上搜索和“热点话题推荐”相关的文献,仅搜索到了8篇,其中文献[152]和[158]均是基于传统的推荐算法集合社交网络的特点展开热点话题推荐的研究。李倩倩在相关研究中根据微博的特点、话题的热度、微博发布者的特征、微博发布的事件信息等,提出了微博话题协同过滤推荐方法。张乘斐在考虑直接将朴素贝叶斯应用于热点话题推荐存在不足的基础上,依据社交网络的特点对朴素贝叶斯网络进行改进,提出了一个基于朴素贝叶斯分类的热点文本选择算法,实现社交网络中的热点话题推荐。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。