基于内容过滤的信息推荐技术思路是:构建用户偏好模型和信息资源模型,并实现两者之间的精准匹配。其中,用户兴趣建模作为基于内容过滤信息推荐的基础,其建模效果直接影响推荐结果的准确性。用户兴趣建模核心工作包括三个部分,用户兴趣数据的获取、兴趣表示方法的选择、兴趣特征的选择及其权重计算。目前来看,优化用户兴趣模型通常从第三个部分切入,即通过选择合适的兴趣特征并提出合理的权值计算方法,准确描述用户兴趣,提升用户兴趣模型的预测能力,从而提高推荐系统的推荐效果。
用户对某一主题下的资源的选择通常可以反映该用户的兴趣,因此,资源的主题通常被视为用户关注或使用资源的主要原因[21],一些研究者以主题作为用户兴趣的表示特征,并以用户对某一主题的资源访问频率作为用户对资源兴趣强弱的依据。Wang等[22]以对某类主题资源的访问时间和访问密度为依据,判断用户对该类资源感兴趣,Michelson等[23]先对主题进行分类,然后分析哪些主题频繁出现,并以其表征用户兴趣。这些研究一定程度上推动了兴趣建模研究的进展,但这些做法也存在不足,即忽视了资源库中不同主题资源数量的不同对用户带来的影响,用户的频繁选择可能是由于资源量的差异所导致的展示机会不同,进而表现在用户选择数量上存在差异;而根据用户资源记录集中于热门主题这一现象开展的模型构建工作,很可能已经造成兴趣表示的偏差,影响了用户兴趣建模质量。(www.xing528.com)
针对这一问题,需要将频繁展示的主题权重降低,对少有展示的资源提高权重,校正主题热度带来的偏差,本节提出一种基于主题热度差异进行调权的用户兴趣建模方法,通过统计资源库中各类主题下资源的数量,对用户兴趣特征权值进行调整,从不同主题下资源数量的角度设计用户兴趣建模方案,最后以向量空间模型对用户兴趣进行表示,进行资源推荐实验以验证本节策略的效果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。