首页 理论教育 信息推荐系统计算隐式评分方法

信息推荐系统计算隐式评分方法

时间:2023-10-31 理论教育 版权反馈
【摘要】:ReadSizeu表示博客di中用户实际阅读的部分所包含的文字个数,而不是整个博客di所包含的全部文字个数。隐式评分的计算通过以上对用户阅读速度和阅读比例行为的分析,可以综合用户u对博客文章di的阅读速度偏好得分和阅读比例偏好得分,计算出用户u对博客文章di的隐式评分IRu:其中,α为权重因子,用来决定阅读速度偏好得分和阅读比例偏好得分哪一个权重更大。IRu的取值范围是[0,1],隐式评分值越高表示用户u对于博客di的兴趣越高。

信息推荐系统计算隐式评分方法

用户阅读不同博客文章所花费的时间是不同的。用户阅读博客文章所花费的时间从一定程度上反映了用户对这篇博客文章的兴趣度。另一方面,用户对博客文章的阅读完成情况也反映了用户对博客文章的兴趣度。在移动环境下,用户阅读博客时的阅读速度和阅读博客的比例是两个最主要的反映用户兴趣度的指标。以下就是从用户的阅读速度偏好得分和阅读比例偏好得分这两个维度,计算用户对相应博客文章的隐式评分。

(1)阅读速度偏好得分

①Duen-ren Liu等提出以用户阅读博客di所用时间除以博客di包含的全部文字个数得到用户的阅读速度,由于用户不一定将整篇博客全部阅读完,因此我们将此方法加以改进,记录用户u阅读博客di所用的时间,和用户u实际阅读的博客di的部分所包含的文字个数,从而,用户u阅读博客di的平均每字所用时间(PerWord Time)PWTimeu(di)的计算公式如下:

其中,Timeu(di)表示用户u阅读博客di所用时间。ReadSizeu(di)表示博客di中用户实际阅读的部分所包含的文字个数,而不是整个博客di所包含的全部文字个数。同时,可以根据如下公式计算用户的历史平均阅读每字所用时间(Average PerWord Time)APWTimeu:

其中,APWTimeu表示用户的历史平均阅读每字所用时间,Du表示用户u阅读过得所有博客文档的集合,|Du|表示文档集合中包括的文档的个数。

②用户u阅读不同博客的速度是不同的,如果用户u阅读博客di的速度比历史平均阅读速度快,也就是用户u阅读博客di的平均每字所用时间PWTimeu(di)比用户u的历史平均阅读每字所用时间APWTimeu短,表明用户u对博客di的兴趣度处于一般兴趣程度或者不感兴趣,相反,如果用户u阅读博客di的速度比历史平均阅读速度慢,也就是用户u阅读博客di的平均每字所用时间PWTimeu(di)比用户u的历史平均阅读每字所用时间APWTimeu长,表明用户u对博客di的兴趣度较高。基于以上理论,我们提出阅读速度偏好得分(Reading Speed Preference Score)的概念,用户u对博客文章di的阅读速度偏好得分RSPScoreu(di)的计算公式如下:

其中Du表示用户u阅读过得所有博客文档的集合,当PWTimeu(di)小于APWTimeu时,表明用户u对博客di的兴趣度处于一般兴趣程度或者不感兴趣,由于移动终端的显示区域有限,系统仅推荐那些用户最感兴趣的博客,这种情况下博客di不可能出现在博客推荐列表中,记RSPScoreu(di)=0。当PWTimeu(di)大于APWTimeu时,用户阅读速度偏好得分RSPScoreu(di)的取值范围是[0,1],得分越高表示用户对文档di的兴趣越高。(www.xing528.com)

(2)阅读比例偏好得分

用户阅读博客时,并不会阅读每一篇博客文章,也不会阅读每篇博客文章的所有部分。如果用户u将博客di从头到尾看了一遍,表明用户对博客di很感兴趣;如果用户u只阅读了博客文章di的一部分发现没有继续阅读下去的兴趣,停止阅读这篇博客,转而阅读其他博客文章,表明用户对博客di不感兴趣,博客di不符合用户的偏好。在移动环境下,用来阅读博客的移动设备的屏幕显示区域有限,而博客文章通常都会有一定的长度,因此,用户需要拉动滚动条或者翻页才能看完博客的全部内容。可以通过记录用户拉动滚动条的位置和翻页情况计算出用户实际阅读的博客的部分占相应博客全部部分的比例。基于以上理论,我们提出阅读比例偏好得分(Read Percent Preference Score)的概念,计算用户u对博客文章di的阅读比例偏好得分RPPScoreu(di)的公式如下所示:

其中,ReadSizeu(di)表示用户实际阅读博客文章di的部分所包含文字的个数,WholeSizeu(di)表示博客di所包含的全部文字的个数。用户u阅读博客di的比例越高,那么用户u对于博客di的阅读比例偏好得分RPPScoreu(di)就越高,表示用户u对于博客di的兴趣度就越高。RPPScoreu(di)的取值范围是[0,1]。

(3)隐式评分的计算

通过以上对用户阅读速度和阅读比例行为的分析,可以综合用户u对博客文章di的阅读速度偏好得分和阅读比例偏好得分,计算出用户u对博客文章di的隐式评分(Implicit Rating)IRu(di):

其中,α为权重因子,用来决定阅读速度偏好得分和阅读比例偏好得分哪一个权重更大。IRu(di)的取值范围是[0,1],隐式评分值越高表示用户u对于博客di的兴趣越高。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈