首页 理论教育 关联检索:基于语义网的个性化网络学习服务及其应用

关联检索:基于语义网的个性化网络学习服务及其应用

时间:2023-11-26 理论教育 版权反馈
【摘要】:关联检索源于文本集合中词与文档之间的关联度统计研究。关联检索的基本思想是构建一个文档、索引词和查询之间的关联图或网络模型,然后利用该模型探索关键词和文档之间的传递关联关系以提高信息检索的质量。通过研究发现,在个性化推荐中,系统可以利用用户之间的这种传递关联关系缓解数据稀疏问题。

关联检索:基于语义网的个性化网络学习服务及其应用

关联检索源于文本集合中词与文档之间的关联度统计研究。关联检索的基本思想是构建一个文档、索引词和查询之间的关联图或网络模型,然后利用该模型探索关键词和文档之间的传递关联关系以提高信息检索的质量。

这种传递关联关系也体现在人们的日常生活中,比如:王五将学习资源A推荐给李四,李四又将学习资源A推荐给张三,因此张三和王五之间就构成了传递关联关系。通过研究发现,在个性化推荐中,系统可以利用用户之间的这种传递关联关系缓解数据稀疏问题。

通过关联检索探索用户之间的相似性

设C={c1,c2,c3}表示拥有3个用户的集合,I={i1,i2,i3,i4}表示拥有4个学习资源的集合,表示拥有3×4=12个元素的用户评级矩阵

R矩阵中行表示用户,列表示学习学习资源,如第一行表示用户c1观看了电影i2和i4,分别给予评分为3和4;通过矩阵R,将评分值设置为1,可以得到矩阵B,B表示用户是否使用了某项学习资源:

从B矩阵的第二行可知c2使用了i2,i3,i4,并且从矩阵R和B可知c1和c2都使用了i2和i4,根据相似度原理,可以断定c1和c2相似度较高,学习资源i3可通过c2推荐给c1,但是i1却无法推荐给c1。在上例中只有4个学习资源,目前Internet中的学习服务提供商提供的学习学习资源数量少则几十万,多则几百万,仅仅通过相似用户的推荐,将会产生“暗信息”,有些学习资源将永远得不到推荐,使得推荐内容覆盖率达不到满意的程度。

根据相关检索原理,将用户作为一组节点,学习资源作为一组节点,将B矩阵用双向图表示,如图8-2所示:

图8-2 协同过滤中传递相关示例(www.xing528.com)

现假设为c1进行推荐,设关联路径为长度为3,c1和c3存在c1-i2-c2-c1和c1-i4-c2-i3两条路径,系统可将i3推荐给c1,而i4和c1不存在长度为3的路径,因此无法推荐给c1。如果扩展路径长度到5,可发现i1可以通过路径c1-i2-c2-i3-c3-i1和c1-i4-c2-i3-c3-i1推荐给c1

根据以上分析作如下定义:

定义1:直接推荐路径,表示一个用户直接为目标用户进行推荐。

定义2:间接推荐路径,表示一个用户经过一个或多个关联用户为目标用户进行推荐。

定义3:用户直接相似度,表示直接推荐路径中,用户之间的相似度。

定义4:用户间接相似度,表示间接路径中,推荐用户和目标用户之间的相似度。

从前面的举例分析可知,关联检索方法能探索用户之间的传递性,得到用户间的路径集合和各路径中推荐用户和目标用户间的直接或间接相似度,通过相似度和路径集合之间的运算可得填充评级稀疏矩阵中元素的值以解决数据稀疏问题,计算公式为:

其中i表示用户;j表示学习资源;C′=(C′1,C′2,…,C′n)表示用户的推荐路径集合;C′n表示一条推荐路径所经历的用户的有序集合。aij表示用户ci和用户cj之间的相似度,其中ci和cj依次取路径集合c′n中的元素。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈