在对移动数字图书馆进行个性化推荐的过程中,除了考虑用户的项目评分情况外,还需要对用户的位置情境、时间情境、业务关联情境等情境信息以及用户的兴趣偏好进行深度挖掘,基于此实现用户属性信息共享、用户画像建模以及融合画像的协同过滤推荐。此外,用户的各属性信息在大数据环境下呈指数式爆炸性增长,这极大增加了从海量数据中挖掘用户兴趣倾向与相关服务项目的难度,且项目评分的稀疏性问题也愈加突出。鉴于此,本节在对用户进行画像的基础上,在传统推荐算法中引入用户的自然属性要素、兴趣属性要素、行为属性要素以及情境属性要素,提出基于用户画像的图书馆个性化推荐模型与方法,由此来挖掘用户间关系,并将符合相似用户偏好的图书馆服务项目推荐给目标用户。
第7章阐述了基于情境感知的信息推荐系统,用户情境应包括物理情境和偏好情境。其中物理情境不仅有单一特定类型情境,如日期、具体时间、地理位置等;还具有多种类型情境组合的情况,如{早上10:00,周日,总图书馆2层,A2资源阅览室}表示图书馆用户在周末早上10点时去往学校的总图2层的A2阅览室进行图书借阅。而用户偏好情境主要包含用户使用资源的口味及偏好信息,具体到移动数字图书馆领域,偏好情境则可以通过分析用户借阅图书行为以及对读者阅读的图书进行主题分析来对挖掘用户的阅读偏好。因此,在对移动数字图书馆进行多情境用户画像建模时我们不仅对读者所对应的物理情境特征进行全面的考虑,还充分挖掘用户的偏好情境,以此来构建融合情境的用户画像,有助于图书馆多情境推荐效果的提升。
在本章中,我们将移动数字图书馆用户画像建模过程分为以下三个步骤,即图书馆用户属性分析、图书馆用户信息的获取以及用户画像建模。
(1)图书馆用户属性分析
考虑到图书馆用户在进行图书借阅活动时所产生的一系列行为活动,能充分体现用户特征的属性主要包括四类:自然属性、兴趣属性、行为属性以及情境属性。
①自然属性主要能体现读者的年龄、性别、专业、年级等用户的人口统计特征,通过这些信息可以明晰用户的姓名、年龄、性别、学历层次、收入情况、社会关系等。利用用户自然属性信息,我们能够较为明显地对读者进行区分,如一位研一的土木专业的同学与大一的法学院新生,两者的图书馆服务使用的频率以及借阅的图书内容必然有着较大的差别,这将有助于提升信息推荐的准确性。
②兴趣属性主要是读者在借阅图书的行为过程中所体现的用户倾向,能充分体现读者的需求特征、偏好兴趣、个人消费特征等。在此,我们是将上述资源情境中的偏好情境从情境属性中脱离出来,单独作为用户的兴趣属性来进行考虑,强调了用户偏好在用户画像以及推荐算法中的重要程度。
③行为属性主要是读者在使用图书馆服务过程中所产生的一系列行为,包括文献浏览情况、下载数字图书及文献的情况以及借阅状态等,体现了用户的行为偏好,追踪该属性信息有助于预测用户行为,以此提高数字图书馆的服务效率。
④情境属性主要指的是上述所讨论的资源情境中的物理情境,主要包括时间情境、地理位置情境以及环境情境,体现读者当前的地理位置、周围环境、位置变化等因素。其中时间情境和位置情境通常合称为时空情境。
(2)图书馆用户信息的获取(www.xing528.com)
图书馆用户自然属性信息可通过系统的注册信息获取;用户兴趣属性信息则通过一定的挖掘算法如主题模型、LDA、TF-IDF等来获取偏好主题,从用户借阅图书的名称、图书的所属分类等方面来获得用户的阅读偏好主题;用户行为属性信息可以通过图书的借阅频次、下载的数字文献、预约或取消预约图书情况来获取用户行为偏好;用户情境属性信息则主要包括时间信息、地理位置信息以及环境信息。其中时空情境信息从是否可确切量化的角度可分为两类:一类是可确切且可量化的绝对时空信息,如具体的位置经纬度、样本阅览室101、图书馆入口以及确切的年月日等;另一类是模糊描述时间与位置的相对时空信息,如图书馆一楼、图书馆大门200米处、暑假期间等。时空数据主要可根据定位技术获取,如北斗、无线网络基站、传感器等。环境信息主要客观描述用户所处的自然条件,比如用户所处环境的温度、湿度、光线、噪声、天气状况等,这些数据可以通过传感器、用户手持的智能终端设备直接获取。
(3)用户画像建模
用户画像最关键的环节就是构建用户标签,这里的标签是通过对搜集获得的用户信息进行深入分析后得出的特征标识,这一特征标识可以高度概括用户的该类信息属性;最后将能够体现用户属性的所有标签综合起来,就基本勾勒出了用户的立体“画像”。一般情况下,部分标签通过分析用户的行为数据可以直接获得(如用户年龄、学历层次、通讯工具等),也有部分用户标签需要通过一定的挖掘算法获得(如用户偏好、行为趋向等)。对于基于用户画像的图书馆个性化推荐系统来讲,读者的自然属性标签主要用于描述读者的基本特征;读者的兴趣属性标签则可以充分体现读者的需求偏好;读者的行为属性标签则可以充分体现读者的行为偏好;读者的情境属性标签则可以体现读者当前的地理位置、周围环境、位置变化等因素。通过对读者进行上述的标签化画像,可以较为清晰地表现用户全貌,从而指导图书馆以及图书管理员针对用户的不同情况提供个性化与差异化的服务项目,提高用户服务满意度。
为了便于研究的开展,本节以某高校数字图书馆为例,收集了该校图书馆用户的三个主要维度信息:自然属性信息、兴趣属性信息与情境属性信息,围绕这三个维度构建移动数字图书馆用户的标签体系,然后进行图书馆个性化推荐服务。
①自然属性标签。这里的用户自然属性维度主要用于描述用户的基本情况,如用户的姓名、性别、年龄、身份(本科生、硕士生、博士生、教师等)、专业(文管类、理工类、艺术体育类、医学类)、职称情况(助教、讲师、副教授、教授)、籍贯、联系方式等。
②兴趣属性标签。通过调查,本节整理了体现读者主要兴趣偏好内容的信息:使用移动设备(PDA、平板电脑、智能手机、笔记本电脑)、联网方式(Wifi、2G、3G、4G)、价格偏好即消费能力(30元以下、31~50元、51~80元、81~100元、101元及以上)、风格偏好(科技、政治、理工、外语、文学、娱乐)。
③行为属性标签。用户行为属性维度主要用于描述在数字图书馆服务下用户的行为状态,包括文献浏览及下载情况(1次/周、多次/周、1次/月、多次/月、其他)、借阅图书情况(预约/取消预约)、借阅频次(1次/周、多次/周、1次/月、多次/月、半年以上)以及对图书的评价信息(好评/差评)等。
④情境属性标签。用户情境属性标签主要包括可以反映用户所在位置、发生时间以及周边环境的信息。其一,用户时间信息标签,主要通过时间属性影响用户的兴趣偏好,如某读者浏览图书馆网址的时间节点(如早晨、上午、中午、下午、晚上或者24小时制的时间点)、页面停留的时间长短(长时间停留表示兴趣较大、短时间表示不感兴趣)等。其二,用户位置信息标签,这里的位置信息主要用于表达与读者位置相关的情境信息,如读者所在的地理位置(城市、学校、校区)、读者的位置类型(图书馆借阅室、样本阅览室、图书馆检索中心、图书馆正门、图书馆以南100米等)、周围人群情况或社会关系(独处、恋人、舍友、同学、学长、老乡、老师)等。其三,外界环境信息标签,主要指气候、光照、噪音等外界环境因素变化而带来的影响,如随着光照、噪音的变化,读者选择的服务项目也会随之发生变化。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。