用户兴趣模型的构建基于Web数据挖掘中数据处理的相关步骤,运用了统计分析中的词频分析法及关联规则中的Apriori算法,并在此基础上加以改进和创新,更加完善,也更具实用性。
通过用户兴趣模型的构建,从海量的用户行为数据中挖掘知识,应用于Web个性化荐读服务,在一定程度上提升了复旦大学图书馆的整体服务水平,可以为其他高校图书馆所借鉴,具有重要实践意义。
本章的突出特色在于数据来源质量高、全面,数据采集过程中,结合国际COUNTER标准,并稍作改进,采集100多个数据库的行为数据,因此数据源更具全面性和完善性;通过会话ID将不同文章进行关联,并采用基于一次迭代的Apriori算法,避免多次扫描数据库,大大提升了查询效率。
不足之处主要在于用户兴趣模型是基于读者浏览页面的行为而构建的,挖掘的知识为文章标题之间的联系,得出的成果具有一定的局限性,并未将采集的数据全部应用到模型中去。因此该模型需要继续扩展,其构建应使用到更多的字段,如作者、关键词等,扩展后的模型将更加完善,更具合理性。
【注释】
[1]朱志国,邓贵仕.Web使用挖掘技术的分析与研究[J].计算机应用研究,2008,25(01):29—32,36.
[2]代文征.Web用户兴趣模型研究[J].软件导刊(教育技术),2011(06):78—80.
[3]蒋萍,崔志明.智能搜索引擎中用户兴趣模型分析与研究[J].微电子学与计算机,2004(11):24—26.
[4]李清华,康海燕,苑晓姣,XIONG Li,任俊玲.个性化搜索中用户兴趣模型匿名化研究[J].西安交通大学学报,2013,47(4):131—136.(www.xing528.com)
[5]陈基漓,牛秦洲.用户兴趣模型在图书馆个性化推荐服务中的应用[J].情报杂志,2009,28(5):190—193,170.
[6]百度百科.统计分析[EB/OL].[2014-06-03].http://baike.baidu.com/view/680978.htm?fr=aladdin.
[7]朱志国,邓贵仕.Web使用挖掘技术的分析与研究[J].计算机应用研究,2008,25(01):29—32,36.
[8]百度百科.Apriopri[EB/OL].[2014-06-03].http://baike.baidu.com/view/2230129.htm.
[9]杨风雷,阎保平.Web用户行为模式挖掘研究[J].微电子学与计算机,2008,25(11):146—149.
[10]蔡皎洁,张玉峰.基于客户兴趣语义挖掘的产业集群信息平台构建研究[J].情报杂志,2013,32(6):161—166.
[11]朱志国,邓贵仕.Web使用挖掘技术的分析与研究[J].计算机应用研究,2008,25(01):29—32,36.
[12]杨斌,武彬.基于点击流的客户行为分析引擎的设计与实现[J].计算机工程与设计,2007,28(13):3042—3045.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。