(一)阅读推广资源知识挖掘模式构建
在公共图书馆的阅读推广活动中,最重要的两类资源一个是用于阅读推广的书籍、文献、期刊等资源,另一个是读者信息资源(读者所产生的阅读行为、阅读规律等信息以及其心理偏好等)。在持续的阅读推广工作中,对这两类资源的深入挖掘和有效利用对于公共图书馆持续、全面地开展阅读推广具有重要意义。如何对书籍、文献、期刊等资源进行整合升级以满足读者日益增长的个性化、差异化的阅读需求,以及如何利用对读者阅读行为的分析从而更好地预测阅读推广的发展趋势以及发展内容是研究阅读推广模式的重要内容。
近几年,国家政府以及省级、地市级、县级等各级政府机构对于教育和阅读推广越来越重视,我国公共图书馆的馆藏资源数量也正在不断增加,同时可用于阅读推广的资源数量急剧增加,但是,在公共图书馆的阅读推广开展过程中,读者实际阅读和接触到的资源少之又少,造成了公共图书馆在阅读推广中资源的极大“浪费”。同时,在阅读推广活动中,公共图书馆缺少对于读者阅读行为规律的分析,没有抓住时代发展下读者的阅读特点,没有满足读者的个性化、差异化的阅读需求。这也进一步反映出构建阅读推广资源是知识库的必要性和重要性。[2]
(二)基础信息库的构建
1.阅读推广资源信息库的建立
阅读推广资源信息库的建立是整个阅读推广服务模式的基础,同时也是一项艰巨的任务。信息库的建立是整个服务模式运作的基础,是一项基础而艰巨的任务。完备、系统阅读推广资源信息库的建立是公共图书馆进行长期、持续发展的阅读推广机制体制的重要前提。用于建立阅读推广资源信息库的基础数据包括三大类,第一类为公共图书馆的数字图书馆资源,第二类为网络资源,第三类为其他共享资源(例如图书情报机构的共享资源)。其中,数字图书馆资源包括图书、文献、音频、视频、图片等各类实体资源,以及各类电子资源(例如电子书、各类数据库等)。将资源数据进行采集、收集和导入,并将资源数据进行清洗和预处理,过滤掉无用的信息,尽可能避免重复、冗余以及噪声。
2.阅读推广读者信息库的构建
在阅读推广中阅读推广的读者信息也是重要的资源。读者的完整信息库能保证在充分挖掘的基础上,了解读者的普遍需求与差异化、个性化需求,从而制定具有针对性的阅读推广方案以及活动。通过对读者的信息数据进行分析,将其中用于建立读者信息库的基础数据分为三类。第一类,读者的持久固定信息,例如读者的身份信息,包括读者的姓名、性别、民族、年龄、单位、教育程度、地址等信息。第二类,读者的阅读行为信息,即利用跟踪日志以及Web日志记录下的读者阅读行为信息,其中包括静态信息(例如到访次数、Web停留时间、下载次数、图书点击率等)。动态信息包括对推送书籍的响应频率、读者的年龄分布、性别比例等。第三类,读者的个人主观信息,例如读者感兴趣的专业领域、方向,想获得的信息、喜欢的图书类型、反馈信息以及提出的改进意见等。将读者的三类基础数据进行采集、收集和导入,并将基础数据在建库前进行预处理,减少数据的冗余和无关信息的干扰,为知识挖掘提供更加规范和有用的数据。将预处理之后的数据经过分析和挖掘,提取输入信息的概念和主题,解析出用户信息库的字段,将数据添加到阅读推广对象信息库中。阅读推广对象信息库需要依据Web日志以及跟踪日志的变化进行更新。通过建立阅读推广对象信息库,可以从中挖掘出更多有价值的信息和模式,从而提高阅读推广模式对于读者需求和发展趋势的匹配度。
(三)知识挖掘与阅读推广资源知识化
1.阅读推广资源知识挖掘与知识库的建立
通过知识挖掘技术将阅读推广资源信息库中的海量数据资源进行横纵结合、深入知识内在关系的数据分析和知识挖掘,将知识进行聚类分析。通过一定的知识挖掘算法和工具,分析各类知识之间的语义关联、主题关联以及馆藏之间的借阅信息关联,将阅读推广资源之间进行有效的知识关联,丰富读者的阅读选择。通过阅读推广资源的深入挖掘,可以有效地将馆藏资源之间建立联系,为读者提供更多的所需类型的阅读资源,同时将资源以及关联形成知识库。
2.读者信息资源的知识挖掘与读者画像的建立
第一,是对读者阅读需求的知识挖掘。读者的阅读需求大致可分为三类,分别为读者当下的阅读需求,读者模糊意识中的阅读需求以及读者自身也尚未意识到的潜在的阅读需求,即未来的阅读趋势。通过对已有阅读行为和阅读需求的读者的需求信息和访问行为进行挖掘推断出读者没有表达出来的以及未意识到的潜在的需求,进而预测读者的需求变化趋势。(www.xing528.com)
第二,是对读者阅读行为的知识挖掘。以阅读推广对象信息库中的基本信息为基础,对数据进行筛选、分析、整合以及关联分析和聚类分析,挖掘读者的心智模式、心理特点以及阅读行为规律,并对挖掘出的读者的心理偏好和阅读行为方式等结果进行分析和评价。利用知识挖掘技术形成更加精准和人性化的“读者画像”。根据每个读者独特的“读者画像”,为其提供更加具有针对性、人性化、个性化的阅读推广模式体验,例如不同的阅读推荐内容的展示形式、不同的人机交互方式等,充分考虑读者的个性化体验需求,使用户的满意度和满足度达到最高,激发读者的阅读兴趣同时有助于读者培养终身阅读的习惯。
(四)关键技术
1.数据库相关技术
总的来说,在互联网时代以及大数据时代发展下,数据库相关技术成为一项必备的且十分关键的技术,数据库技术的相关内容包括数据库的框架设计以及存储计算等方面所形成的计算机技术。利用数据库相关技术我们可以将大量的数据进行存储、组织与研究,同时也可以实现对数据的集中采集与技术性分析等工作。计算机数据库技术一直在不断的发展和更迭,但是数据库技术有着诸多特征。
第一,数据库的独立特征。计算机数据库技术同时拥有逻辑独立性和物理独立性。逻辑独立性体现在当数据库中的数据含义、数据项甚至是数据的种类出现变化时,不需从数据库的源代码进行调整,数据库的逻辑框架会根据数据的变化而发生转变。物理独立性是指在使用数据库进行分析时,当数据库的架构发生变化时不会影响应用程序或应用软件。
第二,数据库的共享性。构建数据库的一个重要的目的就是将数据进行跨地区、跨组织等共享。
第三,数据库的组织特性。数据库中的各项数据以及各个数据表都存在紧密地联系,构成了相关的组织结构形式。目前最新的数据库技术为No SQL数据库技术,它打破了传统的关系型数据库的关系模型,按照一种自由的方式存储数据,并且提供了新的访问接口,克服了传统数据库的很多缺点。
2.数据挖掘技术
数据挖掘技术是一项高效利用数据信息、分析数据并发现其价值的核心技术,同时也发展成为知识挖掘及知识发现重要步骤。数据挖掘是从数据库中的数据集合中自动利用算法抽取出隐藏的有用信息的过程,这些抽取出来的有用信息可表现为规则、概念,或者是模式等。那么利用数据挖掘将有用的信息抽取出来后就可以应用于接下来的决策以及预测未来发展趋势等研究中。数据挖掘算法的输入是已经构建好的数据库,算法的输出为通过数据挖掘所发现的知识或者是模式,算法的实际处理过程涉及搜索方法的设计。开展数据挖掘时,需要预先确定挖掘的对象、挖掘的任务以及挖掘的方法。在数据挖掘技术中,被广泛应用的是统计方法中的关联分析法,机器学习中的人工神经网络、决策术技术以及遗传算法等。
3.知识挖掘技术
知识挖掘实质上是通过数据挖掘完成的,核心内容为在一定目标下已有数据、已有知识形成新的知识。在搜集到读者的阅读需求后,通过一定的数据处理与分析,再加上原来已有的知识进行分析处理,帮助读者得到新的、潜在的需求,这种新的潜在的需求是读者之前并不知道的。既有数据是大量的、有噪声的且不具备一定规律的,而通过知识挖掘分析和提取后的信息是有用的、具备一定知识性的信息。通过知识挖掘可以更加充分地利用数据库中的数据信息,得到更多新的知识及新的模式。主流的知识挖掘算法有序列模式算法、聚类分类术算法、混合学习算法及灵活模式的知识挖掘算法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。