在数字图书馆资源聚合中应用文本聚类分析的方法,从数字图书馆资源内部以及外部特征出发,无需事先设置知识结构分类体系,而是利用资源聚合原理使数字图书馆资源呈现出集簇状,同簇资源相似度尽量高,不同簇资源相似度尽量低,进而根据数字图书馆资源呈现出的层次簇状结构为之选择一种或多种合适的表示结构,从而深入地挖掘出隐含在数字图书馆资源之间的语义关系。传统的聚类算法都是建立在凸球形的样本空间上。当样本空间不为凸时,算法会陷入“局部”最优。另外,许多文档之间没有公共词语存在,导致文档矩阵具有高维性和稀疏性,而且聚簇中心也没有提供可以理解的聚簇描述。为了能在任意形状的样本空间上聚类,收敛于全局最优解,解决文档矩阵的高维性和稀疏性等缺点,研究学者最近开始利用谱方法来聚类。谱聚类方法建立在谱图理论的基础上,通过计算数据相似关系建立相似度矩阵,以该矩阵的前k个特征向量来对不同的数据点聚类。与其他聚类方法不同,谱聚类不容易陷入局部最优解,而且可以有效识别非凸分布的聚类。因此,本文选用谱聚类作为数字图书馆资源聚合方法。
以用户为中心,根据用户的个性化需求开展具有针对性和主动性的信息服务,是提高信息服务质量和信息资源使用效率的重要手段。资源服务推荐是满足用户个性化价值追求的有效手段之一。基于内容的推荐可以解决存在的用户冷启动、评分矩阵稀疏等问题,本文利用关联语义链和协同过滤算法提出了数字图书馆资源服务推荐算法。实验证明该算法充分挖掘了用户信息需求并产生数字图书馆资源推荐信息,并且推荐效率较高。由于以关键词词频作为计算依据,不能准确表达数字图书馆资源的语义信息,难以区分数字图书馆资源的品质和风格,导致了数字图书馆资源的结构化程度较低,限制了资源的有效利用和共享,无法充分挖掘用户潜在的信息需求,因此本文将本体作为反映资源属性关系的模型,提出一种基于本体规则推理和语义相似度计算的数字图书馆资源推荐方法,以此解决推荐系统中资源的语义缺乏、结构化程度低等问题,并充分挖掘用户潜在需求,为数字图书馆资源服务推荐提供一种新思路。利用“聚合”以及服务推荐等方法对数据和信息层面进行资源聚合,基于语义层面对资源内在特征、知识内容的深度揭示进而对用户进行服务推荐,使得语义网络环境下数字图书馆资源聚合以及服务推荐成为提升图书馆知识服务水平的重要渠道。本文通过构建的领域本体计算关键词的语义相似度并获得文献之间的语义相似度矩阵,利用谱聚类方法将文献聚集成文本簇。最后采用协同过滤推荐方法,在文本簇中查找用户相似性较高的邻居,并向用户推荐文献资源。实验结果证明,上述三种算法与传统协同过滤算法相比,具有更好的推荐精确性,并且在一定程度上缓解了数据稀疏问题。本文为增强资源服务推荐的准确性和针对性提供了一种新途径,有利于推进数字图书馆资源产品的开发与利用,为用户提供更符合其需求的数字图书馆资源推荐服务。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。