首页 理论教育 基于图的个性化推荐研究成果

基于图的个性化推荐研究成果

时间:2023-11-24 理论教育 版权反馈
【摘要】:关于图的方法有很多,它们之间的不同之处在于损失函数和正则化项选择的不同。Zhu等[172]将高斯场和调和函数应用到半监督学习中,引入了一个二次损失函数,对于标记的样本具有无穷大的权重,并混合无标记的样本,对于这些无标记的样本附加一个基于图的拉普拉斯正则项。全局和局部一致性方法带有规范化的拉普拉斯,因为正则项和二次损失函数已被文献[173]提出。在文献[163]和[175]中,还探讨了基于边界和基于流形的正则化。

基于图的个性化推荐研究成果

基于图的半监督学习是一种比较流行的方法,该方法假设相似样本具有相似的类标号。首先要创建一个全连通图,其中,“顶点”是有标签和无标签的样本;“边”用于连接任何两个顶点i和j并且带有权重Wi,j,代表每对顶点间的相似度。

关于图的方法有很多,它们之间的不同之处在于损失函数和正则化项选择的不同。Zhu等[172]高斯场和调和函数应用到半监督学习中,引入了一个二次损失函数,对于标记的样本具有无穷大的权重,并混合无标记的样本,对于这些无标记的样本附加一个基于图的拉普拉斯正则项。全局和局部一致性方法带有规范化的拉普拉斯,因为正则项和二次损失函数已被文献[173]提出。Blum和Chawla[174]提出的算法是基于图的最小划分,也就是采用样本之间成对的关系来学习。在文献[163]和[175]中,还探讨了基于边界和基于流形的正则化。

正则化框架可以描述为一个优化问题带有两个正则项和任意的损失函数,即

其中,第一项表示一种特定的损失函数,例如:在SVM中的Hinge损失函数,主要用于增强两种不同类别样本的分布具有大的间隔。第二项倾向于使决策函数成为一个简单的分类器,并且rH的权重用于控制决策函数f在再生希尔伯特空间Hk中的复杂度。第三项强迫相似的样本具有相似的输出,根据所有训练样本的相似度权重矩阵W。参数rM的权重,用于控制函数复杂度在边缘分布的内在几何结构上,可以惩罚f沿着瑞利分布的流形M。(www.xing528.com)

流形正则化可以定义为:

其中,f=[f(x1,…,f(xl+u))]T在有标签样本和无标签样本上得到的一个向量,并且f定义为:,φ是一个从低维空间到高维希尔伯特空间H的非线性映射,K是一个特定的核函数;L是图的拉普拉斯矩阵,表达为L=D-W,并且D是一个对角阵,它的第i个对角为,Wij在数据邻接图中是边的权重。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈