基于图的个性化推荐研究成果

时间：2026-01-27 理论教育小霍霍版权反馈

【摘要】：关于图的方法有很多，它们之间的不同之处在于损失函数和正则化项选择的不同。Zhu等［172］将高斯场和调和函数应用到半监督学习中，引入了一个二次损失函数，对于标记的样本具有无穷大的权重，并混合无标记的样本，对于这些无标记的样本附加一个基于图的拉普拉斯正则项。全局和局部一致性方法带有规范化的拉普拉斯，因为正则项和二次损失函数已被文献［173］提出。在文献［163］和［175］中，还探讨了基于边界和基于流形的正则化。

基于图的半监督学习是一种比较流行的方法，该方法假设相似样本具有相似的类标号。首先要创建一个全连通图，其中，“顶点”是有标签和无标签的样本；“边”用于连接任何两个顶点i和j并且带有权重Wi，j，代表每对顶点间的相似度。

关于图的方法有很多，它们之间的不同之处在于损失函数和正则化项选择的不同。Zhu等［172］将高斯场和调和函数应用到半监督学习中，引入了一个二次损失函数，对于标记的样本具有无穷大的权重，并混合无标记的样本，对于这些无标记的样本附加一个基于图的拉普拉斯正则项。全局和局部一致性方法带有规范化的拉普拉斯，因为正则项和二次损失函数已被文献［173］提出。Blum和Chawla［174］提出的算法是基于图的最小划分，也就是采用样本之间成对的关系来学习。在文献［163］和［175］中，还探讨了基于边界和基于流形的正则化。

正则化框架可以描述为一个优化问题带有两个正则项和任意的损失函数，即

其中，第一项表示一种特定的损失函数，例如：在SVM中的Hinge损失函数，主要用于增强两种不同类别样本的分布具有大的间隔。第二项倾向于使决策函数成为一个简单的分类器，并且rH是的权重用于控制决策函数f在再生希尔伯特空间Hk中的复杂度。第三项强迫相似的样本具有相似的输出，根据所有训练样本的相似度权重矩阵W。参数rM是的权重，用于控制函数复杂度在边缘分布的内在几何结构上，可以惩罚f沿着瑞利分布的流形M。(https://www.xing528.com)