首页 理论教育 个性化推荐系统:分析与设计

个性化推荐系统:分析与设计

时间:2023-08-08 理论教育 版权反馈
【摘要】:通过研究图书馆的图书借阅记录等信息,来预测读者未来可能借阅的图书,提高图书馆的整体服务水平和借阅图书效率以及提高图书的利用效率,是图书个性化推荐系统进行数据挖掘的最终目标。个性化推荐系统在图书馆中的应用同其他行业相比,有巨大的优势。因此对整体的图书馆个性化推荐系统而言,不存在系统冷启动的问题。

个性化推荐系统:分析与设计

(一)系统的背景概述

1.河北科技大学图书馆概况

河北科技大学图书馆新建于2005年,当前建筑使用面积达到1.5万平方米。图书馆设置有6个图书藏书室,1个期刊过刊阅览室以及1个电子阅览室,另有基础书库1个。本馆馆藏纸质图书100多万册,每年订购期刊900余种,包含外文期刊10多种。我院图书馆于2008年开始使用MELINETS管理系统。MELINETS是由北创软件自主开发研究的图书管理软件。它实现了全图书馆的办公以及图书管理的自动化。从2008年运行至今MELINETS管理系统积累了大量的数据,但由于MELINETS本身不带数据挖掘功能,不具备对读者进行图书的关联推荐等功能,不能进行更深层的个性化信息服务。为了让读者更快更准确地借阅自己想要的图书,根据本图书馆的现实情况,设计一个图书推荐系统。

2.图书馆信息系统介绍

河北科技大学图书馆当前用的是MELINETS,MELINETS是发展创新的新一代图书馆自动化系统,系统设计先进,采用CIS、B/S和数据库服务器的体系结构,业务应用系统采用C/S结构,文献检索服务采用B/S架构,数据库平台支持SQL SERVER、Oracle、Sybase等多种数据库,系统采用Delphi、JAVA、C等多种语言开发,增强系统的持续性和稳定性。自动化系统包含采访、编目、流通、期刊、典藏、公共检索、系统管理等子系统,支持MARC数据的输入、输出交换。公共检索子系统采用B/S结构,可实现Web方式进行书目数据检索查询和读者服务。

笔者研究的目标是以图书馆管理系统的现状为出发点,新建一个信息推荐子系统对其功能进行完善,将读者的历史借书信息以及图书数据进行处理和分析,通过相应的算法完成数据挖掘分析,并通过分析结果可以了解读者将来的借阅可能,从而主动向读者推荐他们可能感兴趣的图书。

(二)系统可行性分析

近些年网络技术的发展非常迅速,在此背景下信息化和数字化是图书馆未来的发展方向。近几年,我校在图书馆数字化建设方面不断地投入,图书馆的网络电子设备不断的更新换代。随着图书管理系统的多年运行,数据库的不停更新、系统中积累了大量的数据。其中主要包括图书的数据、读者的信息以及借还书记录等。但是,这些数据目前基本还只应用于业务应用和简单的关联查询、统计分析,数据的综合利用水平不高,隐含在这些数据背后有价值的规律还有待于进一步发掘、利用。在此基础上,可以利用数据挖掘算法对这部分数据进行转换、分析。通过分析数据挖掘的结果不光能够对读者提供个性化推荐服务还能对图书的采购工作提出指导意见为未来图书馆的发展提供更好的建议。我们通过对读者的借还书记录进行数据挖掘,可以根据读者的具体爱好将读者细分成不同的群,有针对地进行个性化推荐服务。在读者群内通过分析能够得到读者未来借阅的书目,从而向读者推荐图书。通过分析图书大类的综合借阅率以及它们之间的借阅联系可以有针对性地购入图书资源以及科学的布置馆藏。

通过研究图书馆的图书借阅记录等信息,来预测读者未来可能借阅的图书,提高图书馆的整体服务水平和借阅图书效率以及提高图书的利用效率,是图书个性化推荐系统进行数据挖掘的最终目标。

(三)图书馆个性化数据挖掘功能需求

根据图书馆个性化挖掘的需求,需要完成以下几个功能。

第一,根据读者的特征和借阅行为以及兴趣爱好将读者聚类分析。高校读者的数量庞大,根据读者的特征进行聚类,将读者分为若干个读者大群。群内读者的具有相同的特征,并且与其他群的读者特征不同。(www.xing528.com)

第二,对图书进行关联分析的功能。在读者大群中,对本群的所有读者借阅记录进行分析,研究本群内读者借阅一本图书的时候,同时借阅另外一本图书的可能性,因为本群的所有读者具有相同的爱好和特征。所以,这时候图书推荐的准确度要高。

第三,根据中图法图书分类,对图书大类进行关联分析。对所有读者借的书,根据中图法图书分类提取大类的索书号,然后通过关联分析,找出隐藏在大类之间的关联关系,根据关系来调整图书的排架工作、下架工作,采购图书工作。

(四)推荐系统中的主要问题解决

冷启动是每个推荐系统建立后面临的最需要解决的问题。推荐系统的冷启动包含三个方面:一是用户的冷启动问题,也就是当一个新用户第一次访问系统的时候系统如何推荐;二是物品的冷启动,也就是有当系统中接收了新的物品的时候如何将物品推荐给用户;三是系统自身的冷启动,因为在建立之初推荐系统处于初始阶段。对推荐系统来说,系统中没有任何的历史数据,它完全面对的都是新的用户,新的物品。

个性化推荐系统在图书馆中的应用同其他行业相比,有巨大的优势。因为在提供服务之初系统中就已经积累了大量的读者借还书数据。因此对整体的图书馆个性化推荐系统而言,不存在系统冷启动的问题。那么研究的重点将主要集中在读者冷启动和图书冷启动。也就是当一个读者刚刚使用图书馆的应用或者一本新图书刚刚被图书馆收藏时,没有任何与之相关的用户行为,如何给读者推荐图书以及如何将新书推荐给读者成为研究的重点。

笔者解决图书冷启动问题主要应用读者的购书推荐表来对新书进行关联挖掘找到新书与读者的关联规则,然后向读者推荐新书。学院的专家和学科馆员根据新书的购入情况和专业发展向本学院的读者推荐有价值的新书。

读者的冷启动问题主要在读者登录系统时,系统根据读者的个人信息向读者展示本分院的借书排行榜。如果读者未登录系统,则读者可以通过查看全院借书榜来查看热门图书。

【注释】

[1]于志敏.智慧图书馆建设[M].乌鲁木齐新疆文化出版社,2O2O.

[2]朱白.数字图书馆推荐系统协同过滤算法改进及实证分析[J].图书情报工作,2017,61(09):130—134.

[3]秦健.基于信息可视化与数据挖掘的高校图书馆推荐系统的设计与实现[D].北京:北京交通大学,2014.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈