首页 理论教育 推荐系统中概貌属性综述及托攻击检测

推荐系统中概貌属性综述及托攻击检测

时间:2023-11-21 理论教育 版权反馈
【摘要】:本节将介绍几种常用的检测托攻击的概貌属性。WDMA是基于RDMA的一种通用概貌属性,只是将稀疏项目中用户评分偏差的权重放大,这个概貌属性具有较RDMA较高的信息增益。DegSim除了基于评分差异的概貌属性,DegSim从概貌之间的相似度角度来度量。DegSim是基于用户概貌最近k个近邻相似度度量的一个概貌属性值。这个概貌属性是专门为段攻击和流行攻击模型设计的,包括段攻击和流行攻击。FMTD属性使评分概貌中被评为极值的评分和填充评分的差异最大化。

推荐系统中概貌属性综述及托攻击检测

本节将介绍几种常用的检测托攻击的概貌属性。由于推荐系统中用户评分的稀疏性和高维度特性,直接在用户—项目评分矩阵上直接实施托攻击检测是不现实的[45,46],并且由于不同的攻击类型评分规律不同,针对不同攻击类型的概貌属性也不尽相同,因而仅使用单一的托攻击检测方法对所有的攻击类型进行检测也不符合实际[55]。基于以上原因,研究者们将精力集中在概貌提取技术和数据降维技术,然后再在抽取的概貌属性集上得到基于监督或者无监督学习的检测算法。为了区分真实评分概貌和攻击评分概貌,研究者们提出各类型的概貌属性,这些属性可以分为通用概貌属性和针对攻击模型的概貌属性[105]。通用概貌属性试图从描述统计学的角度去捕捉概貌的特征,从而区分真实用户概貌和托攻击概貌通用概貌属性基于如下假设,正常用户的概貌和攻击模型生成的概貌存在两方面的不同:第一是在对目标项目评分上,攻击概貌对目标项目的评分通常是最高分(托攻击)或者最低分(核攻击),而正常用户对目标项目的评分与其他的项目评分并无不同;第二是除了目标项目评分外的其他项目的评分上,攻击概貌在对项目的选择上具有随机性,并且评分的分值分布存在差异。因此,攻击模型生成的概貌在评分模式上会和正常用户概貌有偏差[19];针对攻击模型的概貌属性是描述某种特定攻击模型的概貌属性特征。

(1)RDMA(Rating Deviation from Mean Agreement)

RDMA用来计算概貌中项目评分的平均误差值,RDMA属性的计算如公式(2.14)所示:其中,Nu是用户u对所有项目评分的数量,ru,i是用户u在项目i上的评分是项目i上所用评分的平均值,NRi是评分矩阵中对项目i所有评分的个数。

(2)WDMA(Weighted Deviation from Mean Agreement)

其中,Nu是用户u对评过分的项目的个数,ru,i是用户u在项目i上的评分是项目i上所用评分的均值,NRi是评分矩阵中对项目i所有评分的个数。WDMA是基于RDMA的一种通用概貌属性,只是将稀疏项目中用户评分偏差的权重放大,这个概貌属性具有较RDMA较高的信息增益。

(3)WDA(Weighted Degree of Agreement)

另一个基于RDMA的概貌属性WDA,只有RDMA的分子值,是所有概貌评分和这个项目平均评分差的总和,除以项目上评分的个数。

(4)DegSim(Degree of Similarity)

除了基于评分差异的概貌属性,DegSim从概貌之间的相似度角度来度量。由于托攻击概貌是由程序生成的,但是真实用户概貌的评分比较分散,研究者们发现攻击概貌和它的最近邻k个邻居具有较高的相似性。可以用DegSim来捕捉这个特性。DegSim是基于用户概貌最近k个近邻相似度度量的一个概貌属性值。DegSim的计算公式如公式(2.17)所示:

其中,Wuv是用户概貌u和v的皮尔森相似度,k是用户最近邻的个数,k的个数由数据集来决定。皮尔森相关系数用公式(2.1)和公式(2.2)计算。

(5)LengthVar

引入LengthVar是为了计算一个评分概貌和评分矩阵中的平均长度的偏离值,偏离值越大表明该概貌是攻击概貌的可能性就越大。假如一个用户对大部分的项目都有评分,那么这个用户是托攻击的可能性大。LengthVar对当评分矩阵中的项目数量大并且用户概貌填充规模高的情况下检测托攻击概貌比较有效。用户u的LengthVar通过公式(2.18)计算。(www.xing528.com)

其中,Vratingsu是用户u对评过分的项目的数量是评分矩阵中所有用户对项目评分数量的均值;N是评分矩阵中用户的总数。

(6)MeanVar

其中,Pu是用户u的评分概貌;Pt是假设的攻击评分;ri,u是用户u在项目i上的评分;是项目i所有用户评分的平均值;Pu是评分矩阵中用户概貌的个数。

(7)DegSim’

DegSim’是在DegSim的基础上修改而来的。DegSim在检测随机攻击模型和均值攻击模型时有效,但是在检测段攻击模型时,由于段攻击模型攻击概貌包含被选择的项目,被选择项目个数的不同使得攻击概貌的DegSim值随填充项目评分个数的变化而改变,使用原有的DegSim属性值已经不能有效地将攻击概貌和真实概貌分离。本书设计了一种基于DegSim的新的概貌属性。考虑到所有评分时,攻击概貌和真实概貌的DegSim值可能相差不大;而DegSim’则计算了所有评分域,因此只要有一个评分偏离,那么DegSim’值将变大,从而偏离正常值。DegSim’值越大,其成为攻击概貌的可能性越大。

VDegSim由公式(2.20)计算。其中R是评分矩阵的评分值集合,例如在MovieLens中R={1,2,3,4,5};VDegSimr是当评分矩阵中只计算评分是r的DegSim值;是评分矩阵中所有概貌VDegSimr的平均值。

(8)FMTD Filler Mean Target Difference

FMTD是计算评分概貌中各个部分的差异,即填充项目集合和选择项目集合之间的评分差异。这个概貌属性是专门为段攻击和流行攻击模型设计的,包括段攻击和流行攻击。

其中,Pu,T是评分概貌中被给予最值(最高值或最低值)的评分集合;Pu,F是评分概貌中所有其他的评分集合;ru,i是用户u对项目i的评分。FMTD属性使评分概貌中被评为极值的评分和填充评分的差异最大化。

(9)FillerMeanDiff

FillerMeanDiff用公式(2.22)计算。其中,ru,i是用户u在项目i上的评分;是在项目i上所有评分的均值;Pu是用户u的评分概貌;Pt是假设的攻击评分。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈