知识发现(knowledge discovery in database,KDD)是20世纪80年代兴起的一个交叉学科,它是在数据库技术、机器学习技术、统计学技术、人工智能技术等学科研究的不断深化中发展起来的。其最深刻的定义是1996年由Fayyad等人给出的:知识发现是指从大量数据中获得有效的、新颖的、有潜在应用价值的和最终可理解的模式的高级处理过程。换言之,知识发现就是可以对大量的数据库、数据仓库或知识库进行分析处理,进而深层挖掘,寻找数据间潜在的关联(associate)、模式(pattern)、规则(rule)、趋势(trend)等,把人们对数据的应用从低层次的简单查询提升到从数据中挖掘有用的信息和知识,并提供决策支持,它是目前解决“信息丰富而知识贫乏”的一个最佳方法。
知识发现是从海量的数据集合中抽取或提炼出隐性的、有用的、事先未知的知识的过程。知识发现是一种广义的“数据挖掘”。数据挖掘是知识发现系统中最关键的模块,其主要功能是通过利用数据挖掘模型库动态提供数据挖掘方法,包括聚类和分类、关联分析、描述辨别、时间序列分析等,从数据库中发现新的模式、知识和规则,以预测规律,从而形成新的知识库。在数字图书馆建设中,运用知识发现技术可以发现资源的利用率、配置情况、学科关系等知识,在企业技术创新中借助知识发现技术可以帮助企业在技术和产品的研发、市场分析、战略研究中获取知识、共享知识和创新知识。
知识发现的过程主要有三个阶段:
①数据准备阶段:由图情专家和专业领域的专家共同制定数据挖掘的目标及任务,准确、清晰地对任务进行描述,根据任务描述的具体内容,基于数字资源进行数据的采集,对采集后的数据进行一定的预处理工作,包括数据的清洗、再加工和转换等,根据数据的不同种类建立相应的数据库或数据仓库。
②数据挖掘阶段:运用聚类和分类、关联分析、描述辨别、时间序列分析等数据挖掘算法对经过预处理后的数据进行模式的提取。
③知识表示与展示阶段:运用可视化的方式对模式进行表示,形成用户可理解的知识,并通过知识服务平台进行知识产品的服务和展示。
知识发现系统以知识挖掘和数据分析为基础,通过现代技术手段将资源整合、知识发现、信息推送融为一体,实现知识的价值再造。
大数据环境下的海量数字资源是知识发现系统的基石,将大量结构化的元数据和全文数据、半结构化和非结构化的数据融于一体,打破了原有的单一数字资源所带来的局限性,在数据采集的广度上体现了独特的优越性。同时,知识发现系统也是一个学习型的系统,它充分利用或建立关键词表、海量的引文数据库、作者库、机构库、学科分类表、收录来源库、刊种表、学术专业词库、同义词表、单位产出库等基础数据库或知识体系,并可以经过不断地反复迭代和修正,实现科学高效的知识挖掘与数据科学分析,大大提高了知识服务的精准度,真正体现信息服务从资源发现到知识发现的转变。
图情大数据的知识发现系统多基于机构所掌握并可以利用的数字资源,以数据挖掘的相关技术为支撑,对图书、期刊、论文等文献资源进行知识关联与数据分析处理,深入发现隐藏在大量数据背后的信息,建立功能强大的新一代学术资源发现平台,帮助信息用户简捷、快速地获得需要的知识或节点。对信息用户来说,知识发现系统是学习的工具;对信息服务机构来说,它既是一个研究学习平台,更是功能强大的信息管理平台。
目前,国内图情领域所提供的知识发现与服务系统主要有:清华同方中国知网的“CNKI 2.0”行业知识服务平台,重庆维普资讯有限公司的“智立方”知识资源服务平台;北京万方软件股份有限公司的“创新助手”和超星集团的“超星发现”系统等。
1)中国知网的“CNKI 2.0”行业知识服务平台
2019年10月,中国知网正式发布了“世界知识大数据”(WKBD)平台,同时全面启动“百行知识创新服务工程”,即在2020年细分500个行业与学科,分别聚焦产品、技术、管理、学术、教育等领域核心创新能力提升的迫切需求,推出可供各单位量身定制的“知识服务平台”和“知识创新服务系统”。
WKBD发布平台的知识资源的范围,已从学术、教育、科普等出版文献、专利、国家和行业标准、重大科技专项成果等科学数据,扩大到政府规划、党政文件、法律法规、工商信息、社会经济统计等实体性政府数据,以及企业产品标准、行业动态、投资融资、宏观经济、市场消费等社会数据;知识挖掘与知识网络组织的层次,已从题录摘要、全文文献,深化到文献的研究对象、问题、思想、方法、步骤、结果、结论、讨论等主题段落,以及概念、原理、方法、命名实体、经济社会微观运行状态等知识单元;知识大数据的处理与应用技术,已从全文文献特征的智能标注与检索,发展到段落主题及5W2H知识类型标注、知识元本体标注与知识图谱构建、逻辑推理、智能问答,以及内容的动态重组、自动摘要、自动翻译和数据分析的可视化等。这项工程从2016年开始规模化建设,已收录70个国家和地区的33种文献共5亿多篇(部/条),并从中挖掘、清洗出各种知识元82亿条,正在建设成世界第一个融世界科学、社会、政府三大数据体系为一体的综合型大数据,以期在三年内广泛应用于国内国际、各行各业针对重大和复杂问题的大数据研究。
CNKI 2.0知识创新服务运行模式有以下八个流程。
(1)文献生产
“腾云一次数字出版平台”基于WKBD为中国各类出版文献的传统型、增强型、数据型、协创型四种出版模式的网络首发提供文献生产全流程服务,为传统出版物提供印后上网全流程服务。其中,中国知网使用的作者著作权由出版社转授,或经法定许可使用。国际出版文献经《中国学术期刊(光盘版)》电子杂志社有限公司(简称“电子杂志社”)审查,由“腾云转载数字出版平台”转载发布,基本上与一次出版同步。内外版权开放的政府数据、社会数据由“腾云网络数据采集系统”实时定向从原始发布网站采集,其他内容经著作权人授权并提供数据,以确保数据内容的权威性。文献生产的内容如图6-2所示。
图6-2 文献生产
(2)知识加工
文献信息的知识化加工包括文献版式智能解析、数据格式自动转换、文献形式元数据和内容元数据自动标注、信息内容智能审查检校、XML智能碎片化加工、公式图表学术定义等知识元自动识别抽取和对齐,如图6-3所示。“中国知网大数据知识化标注系统”对不同来源、不同类型、不同格式的海量文献信息资源进行自动化、智能化加工处理,使之成为质量可靠、标注规范、便于分析利用和进一步深度组织的文献信息和碎片化知识元集合。其中,知识元为不可再分的最小知识单元,经专家审定后,可通过构建语义关系建成语义词典。
图6-3 知识加工
(3)知识聚合
“知识聚合”是指通过一定的组织方法对海量规范标注的文献、碎片化内容和知识元进行凝聚,以形成多维多层且相互关联的知识体系的过程。“知网节”是中国知网推出的一种知识聚合模式,可在全文、段落、知识元三个层次上,对存在显性关联或可能存在隐性关联的知识内容进行凝聚,如图6-4所示。文献知网节、段落知网节揭示基于引证、主题、学术圈、相似性等全文、段落间的相互关联关系。知识元知网节基于领域知识图谱构建,可揭示主题概念之间的因果、族聚群、总分、属种、同义等微观逻辑关系。基于知网节的三个层次的知识聚合,形成了激发创新思维的新型知识组织方式。
图6-4 知识聚合
(4)大数据融合
“大数据融合”是指从多源异构、语义多样、动态演化的大数据中抽取相关知识,按语义逻辑关联融合形成更接近人类思维的新知识,进而为实际问题求解构造有效知识体系的过程。WKBD融合全球范围的科技、哲学社会科学大数据与政治、经济、社会、文化、生态异构多源大数据,构建全文、段落、知识元三层互联的知识网络(图6-5)。既可提供规范完整的全文文献,也可通过问题、方法、假设、结论等具体知识段落提供支持决策的知识服务,还可通过公式、图片、概念、参数等微观知识元及其复杂关联关系进行知识发现和大数据分析研究。
图6-5 大数据融合
(5)整合传播
“整合传播”是指对不同来源、层次、结构、语言、内容的知识进行集成和结构再建,通过多样化传播渠道与服务功能的整合运用,面向不同受众需求,实现最优的知识传播和知识服务效果。中国知网基于WKBD的《全球学术快报》具有五种整合传播功能:一、统一发现,兼顾跨语言统一发现与精准个性化定制;二、知识挖掘和智能问答,识别用户的知识获取意图,动态重组知识碎片,形成逻辑清晰、结构完整的最终“答案”;三、统一分类,形成细分行业、学科、岗位知识领域的知识体系,并支持内容的自动重组和文献自动摘要;四、研究研读,提供多种工具为跨语言、跨学科、跨领域、跨机构的个人研读和协同研究提供支持;五、评价服务,基于WKBD从学术规范和学术质量两个角度对学术成果进行评价,如图6-6所示。
图6-6 整合传播
(6)定制服务
“定制服务”是指按照每一个机构或个人用户的客观需要或主动表达的知识信息需求,提供高度匹配的服务内容和服务方式的一种服务模式。中国知网“行业知识管理和服务平台”,以RD企业、高校科研机构、创新型党政机关等各类机构核心研究与管理团队面临的核心问题与核心能力建设方向为核心知识需求,建立核心知识体系,全面系统地组织核心知识资源,并基于这些核心知识资源与WKBD中相关知识的知识网络关联,构建完整的知识体系和知识资源体系,形成各行各业的知识服务平台,为企业产品技术管理创新、高校教育科研创新及双一流建设、国家治理体系创新与治理能力现代化,提供定制化知识资源服务(图6-7)。同时,通过标准化的数据标注,支持定制化资源与机构内部相关知识的整合管理,以多维导航、内容检索、知识关联和数据分析等多种功能手段,提供发现、分析、解决问题,以及研究与学习所需要的专业知识,特别是科技与哲社原始创新所需要的基础知识。
图6-7 定制服务
(7)大数据、技术应用
机构创新主要是机构自有知识的创新,“大数据、技术应用”平台支持用户建设打通本单位知识生产、传播、扩散、利用、再生产各环节与全过程,并与WKBD全面连通的机构知识基础设施。“大数据、技术应用”平台包括三类子平台:企业协同创新与大数据研究平台、党政社团协创平台、高校科研协创平台(后两者可参照前者设计),如图6-8所示。其支撑系统统一为“机构知识管理与知识服务系统”(OKMS)和“协同研学平台”(CRSP),可安装在用户内部网上运行,也可在中国知网云平台上设置权限使用。
图6-8 大数据、技术应用
(8)社会化协同研究平台
“社会化协同研究平台”支持机构通过互联网与外部进行协同研究,支持党、政、产、学、研、用、智库、社团协同创新和协同治理,实现跨部门、跨区域、跨行业、跨学科的高效协同,通过知识管理与知识服务支持各机构的项目、技术、研究、管理创新,构建以企业为主体、市场为导向、产学研相结合的创新生态,服务企业创新发展,服务世界一流企业建设。上述“大数据技术应用”平台用于大数据资源的充分开发利用,“社会化协同研究平台”则解决了机构内外显性知识的整合共享及隐性知识的激发外化问题。
CNKI 2.0知识创新服务运行的流程示意如图6-9所示。
图6-9 CNKI 2.0知识创新服务运行的流程
2)维普的“智立方”知识资源服务平台
维普的“智立方”是一个架构于云端集大数据管理、大数据挖掘、大数据分析、数据对象化建模于一体的知识资源服务平台。它以多粒度、规范化的元数据形式,统一整合了期刊文章、学位论文、会议论文、专利、标准、专著(图书)、科技成果、产品样本、科技报告、政策法规共十种最具科研价值的文献数据;整合去重后的文献元数据超过2亿条,覆盖了近20年来国内产出中外文献源的95%;依托于规范、多维度的元数据,可提供高效检索、分面聚类、引文追踪、知识关联图谱、对象构建、对象对比、研究趋势分析、多途径全文保障等服务;同时支持多种常见的文献题录格式的浏览及导出,方便用户管理自己的知识库。维普的“智立方”能快速为图书馆、科研单位和个人用户提供全方位的各类知识资源及情报需求的一体化解决方案。
维普“智立方”中期刊文章、学位论文、会议论文、专利4类资源除提供中文资源外,还整合提供了部分外文资源,能够满足科学研究对外文资源的基本索取需求。
(1)多维排序与动态分面聚类
平台通过对整合元数据的厚粒度梳理,按照不同类型用户对数据不同的关注度,为用户提供包括相关度、被引量、时效性、H指数、影响力等多种检索数据排序方式,方便用户快速定位自己关注的文献。
平台通过对整合元数据的深度聚集,按照整合文献的共同属性对元数据进行动态分面聚类,包括文献类型、发文机构、发文人物、发文主题、发文领域、发文时间等,方便用户直观了解各分面聚类所涉及的文献量,并可根据分面聚类侧重过滤检索信息。
(2)数据关联关系揭示
平台以篇级文献为基础数据处理单元,每篇文献在进行元数据著录整合时,均进行了引用与被引文献双向关联标注,文献元数据不再是孤立的点状存在,而是与引用、被引一起以关系链条的形式存在;数据关联关系的揭示能够帮助用户快速理清该文献研究的来龙去脉。
(3)数据建模与可视化
平台基于海量的文献元数据,通过对元数据间数十亿数据关系的深入挖掘、提取和分析,抽象出与文献高度相关的多维知识对象数据模型,包括领域、主题、学者、机构、传媒、基金、地区等(1 200万作者,13万机构,140万基金,4万传媒,130万主题)。使文献与每个知识对象均紧密结合,形成文献聚集关系网,从任何知识对象出发均能快速找到与其高度相关的其他知识对象与文献本体。
平台依托以多维知识对象数据模型构建的文献聚集关系网,能够为用户提供360°文献关系网络可视化图谱,用户能够通过图谱直观地了解各知识对象与文献本体之间的相互关联。
(4)基础分析报告
平台基于完善的多维度关系数据和先进的知识对象模型,除能够为用户提供检索报告、对象分析报告、同类型对象比较报告等基础报告外,还能够为用户提供学科研究方向分析、竞争情报动态连续追踪等服务,帮助用户快速形成对所需信息的结构性认识,对用户的科研、教学、信息服务等工作均能起到一定的促进作用。
3)万方的“创新助手”
万方“创新助手”是由北京万方软件股份有限公司推出的面向政府、科研院所、高校、企业等单位的科研管理部门,进行科技信息挖掘与分析,进行科技创新能力评估的工具。该工具主要是为解决科研管理部门进行科研项目监控、科研立项查新、学科领域专家搜索、人员科研状况分析、机构科技创新能力评估等问题,提供基于科技文献的信息挖掘与分析服务,辅助科研管理部门进行科学决策。利用该服务工具,研究人员可全面深入了解所关注课题的研究现状,完成特定领域专家与研究机构的研究数据提取,掌握学科最新动向与基金研究热点。
万方“创新助手”的主要特点是建立了一个高效的基于人物、学科、主题、机构和基金的知识服务前端导航系统。知识获取“五要素”(图6-10)前端导航是在进入具体检索之前进行导航,根据用户的需要进行引导、建议,构造出标准检索式,大大提高了查准率,不会出现动辄成百上千检索结果。通过交互式的“五要素”导航,用户可直接获得基于“五要素”知识库的精确检索表达式,表达式的构建符合CQL标准。知识获取“五要素”导航系统可以理解为是一个独立的产品,其最终生成的检索表达式可提交到任意支持CQL的标准检索接口。
图6-10 知识获取五要素
(1)科研项目评审
对公开竞争的科技项目,系统从学科优势、专家团队、成果发表、标准参与制定、科技论文发表、国家重点项目参与情况等角度综合分析评价,生成“机构科研能力综合评述报告”,数据充实完整,为科技管理部门提供立项评审的第一手参考资料。
(2)科研能力评估(www.xing528.com)
系统以学科和行业为主线,为决策者提供人物或机构的、按照时间分布的科研能力评估工具,或横向全方位展示特定领域的专家和机构排名,或纵向揭示机构或个人的整体科研水平。
(3)项目监测跟踪
系统为科研项目管理部门及时监测、跟踪基金项目的进展和成果,按年度、论文类型、机构、人物等灵活展现,生成“项目成果/进展报告”,用数据说话,一目了然。
(4)项目立项科技查新
平台以知识获取“五要素”为核心,从中外文期刊论文、学位论文、会议论文、科技成果、专利、标准、图书专著等多来源进行查新检索,生成“科技查新报告”,为科技项目查新业务提供数据支持和快捷应用工具。
(5)科研立项选题
平台从特定领域全方位展现所关注领域的科技成果、标准、专利、期刊论文、学位论文、会议论文类的科研成果发布状况,协助科研人员了解学科领域或相关主题科研状况,帮助科研人员轻松选题。
4)超星的“超星发现”系统
“超星发现”系统的核心功能定位是基于海量信息资源进行系统的知识挖掘与数据分析。除了涵盖各学科、各类文献及网络学术资源数据外,系统还内置了十分丰富的规范主题词库、作者库、机构库、引文数据库等高质量的控制词表数据资源。以此为基础,“超星发现”系统充分利用数据仓储、资源整合、知识挖掘、数据分析、文献计量学模型等相关技术,实现学术资源的高效、精准、统一搜索,并通过引文分析、分面聚类、知识关联分析、可视化等手段,为用户高效、精准、全面发现高价值学术文献,掌握知识体系相互支撑、交叉、综合的密切关系,从宏观整体把握学术源流和发展趋势,从而帮助用户冲破信息孤岛与信息超载的桎梏,让意外惊喜成为创新的灵感,让洞察全局成为科学探索的法宝,让巨人的肩膀成为知识价值再生的基石。“超星发现”系统的核心功能包括以下几个方面。
(1)多维分面聚类
“超星发现”依托高厚度的元数据资源,采用分面分析法,可将搜索结果按各类文献的语言维度、类型维度、时间维度、主题维度、学科维度、重要期刊维度、作者维度、作者机构维度、刊种维度、地区维度及基金维度等多种方式进行聚类。用户可根据实际需要进行任意维度的组配检索,实现文献的精准化搜索和精炼聚类,将有价值的核心资源按相关度、被引频次、影响因子等方式予以展现。
(2)智能辅助检索
借助内置规范知识库与用户的历史检索发现行为习惯,自动判别并切换到与用户近期行为最贴切的领域,帮助用户实时把握所检索主题的内涵。
(3)立体引文分析
以表格形式列出参考文献、引证文献、相关主题文献和相同作者文献等,并提供文献的引证趋势图,完整地反映文献被引用的生命曲线。借助文献间的相互引证逻辑关系和引用频率分析,“超星发现”能有效测定与评价相关文献、作者或机构的学术影响力,也能分析获得相关学术思想的历史渊源、演变规律和发展趋势。
(4)考镜学术源流
通过单向或双向线性知识关联构成的链状、网状结构,形成主题、学科、作者、机构、地区等关联图,从而反映出学术思想之间的相互影响和源流。
(5)展示知识关联
可按照不同知识概念之间、知识概念和作者之间、知识概念与机构之间关联的相关性重要程度构成网状的知识关联图谱。通过知识关联图谱,可直观揭示某一学科领域的知识点、作者、机构之间的关联关系,反映出某一学科领域关联知识的相互交叉支持强度,也反映出不同学者、不同机构对某一学科领域的研究强度与贡献大小,为研究者从宏观角度把握学科发展方向、拓展学科研究提供思路。同时也将知识挖掘、知识关联分析与可视化技术集于一体,能够将发现数据及分析结果以表格、图形等方式直观展示出来。
(6)揭示学术趋势
具有对检索结果进行年代分布规律分析的功能,研究者可在长时间维度和全面数据分析的高度来洞察该领域研究的起点、成长、起伏和走向,从整体上把握学科研究发展的完整过程,揭示学术的发展趋势。
5)国外主要的知识发现与服务系统
发现服务系统自2008年面世(WorldCat Local)后,发展很快,其中广受注目且在中国市场比较活跃的三个国外产品分别是:Serials Solutions的Summon(2009年7月发布)、EBSCO的EBSCO Discovery Service(简称EDS,2010年1月发布)、Ex Libris的Primo Central(简称Primo,2010年6月发布)。
(1)Summon
Summon是基于美国ProQuest的子公司Ex libris研发的海量元数据仓储的新一代学术资源发现与获取系统。用户可以“一站式”检索图书馆订阅的全部外文电子资源,以及35个重要的、学术质量高的免费开放获取文献,界面更简单,内容更丰富,获取全文更便捷。其主要特点有:
①内容统一索引:Summon是唯一基于统一内容索引的发现服务。索引中包含90多种内容类型,9 000个发行者,100 000种期刊,以及10亿条记录。每周都会添加新的内容来源,并且每天都会更新内容。
②无与伦比的定制能力:Summon是高度可定制的。通过“开箱即用”的SaaS版本,用户可以将自己机构的品牌和导航带入发现环境,修改文本及按钮和标签。那些寻求完全自定义体验的人可以使用功能齐全的API。
③真正的网络规模发现:Summon是多层体系结构,旨在跨越内容孤岛。所有内容均可同时搜索,从而以最高的可靠性产生极快的搜索响应时间。它不依赖于诸如联合搜索之类的旧技术。
④卓越的搜索体验:用户可以在基本搜索框中输入搜索词,也可以利用高级搜索表单来执行查询。除此之外,Summon还为用户提供了提高搜索精度的自动查询扩展功能、自动完成功能以及结果发布后的搜索机会。
⑤密切相关,简洁精炼的结果:统一的结果集可提供更快的结果、出色的导航和构面以及整个馆藏的相关性。通过过滤、分面和排序,可以轻松导航和缩小结果范围,还可以突出显示内容和图像,包括超出收藏范围的结果等。
⑥自动化的情境研究协助:图书馆馆员可以通过将分区推荐、自动搜索指南和实时参考帮助无缝集成在Summon发现环境中来改善整体用户体验。自动化的主题优化建议也可以嵌入搜索结果中。
⑦保存和导出结果:用户可以轻松地从搜索结果中保存条目,并可以选择发送电子邮件或打印,将引文导出到书目管理软件,或对引文进行格式化,以实现快速、轻松的剪切和粘贴。
⑧使用情况统计:为了了解发现服务的使用方式,客户端管理工具提供了对使用情况报告的访问,其中包括热门搜索查询,按时间划分的使用情况明细、搜索次数等。
⑨社区与支持:Summon具有强大的用户社区,用户可以加入列表服务器,查看Summon Wiki或参加实时用户组,以优化发现体验、分享想法并提供反馈。除了这些面向用户的活动外,ProQuest还提供培训和支持。
(2)EDS
将内容和技术结合在一起,EDS可通过最相关和最精确的搜索结果访问图书馆的整个馆藏。
EDS提供了一种有效的方法来搜索用户机构中丰富多样的信息资源。EDS支持从全文数据库、引文数据库和内容集合,如图书馆目录及其他本地管理的数字资源中检索结果。通过将各种内容源的元数据编译和索引到统一的预索引搜索平台,实现集成搜索体验,以便让该平台提供非常快速的最终用户搜索响应。
EDS还提供:
①任何发现服务的最高质量元数据;
②优越的相关性排序;
③索引内容大全,来自大约23 800个供应商的文摘和引文、全文和开放获取资源,包括世界顶级出版商和信息供应商的超过1 000 000份出版物;
④完整的知识库集成和管理功能;
⑤透过API的扩展性;
⑥利用受控词汇作为关键主题索引的功能;
⑦具有基本和高级搜索功能的直观的、多层次的搜索界面;
⑧显示可用性、位置、链接到全文、特定资源的定制信息等;
⑨用于在会话中保存和管理搜索和结果的文件夹选项;
⑩限制器和扩展器旨在缩小搜索结果,并根据格式、位置、馆内可用性以及其他标准将用户引导到最佳可用资源;
⑪ 打印,电子邮件,保存,导出和引用格式选项;
⑫ 社交书签服务随时可用;
⑬ 用于目录记录的丰富数据,包括通过安装应用程序显示第三方资料;
⑭ 为管理员或终端用户在任意时间提供接口访问的帮助以及在线支持和培训。
(3)Primo
Primo图书馆发现服务可以让用户最大限度地利用自己的图书馆馆藏,并为学生和研究人员提供快速访问学术资料和直观方式探索新内容的途径。Primo可与各种图书馆和学术系统无缝集成,以实现端到端的高效工作流程。Primo的主要功能特点有:
①提供用户期望的体验;
②让顾客获得大量的学术资料以及与他们的研究最相关的资源,随时随地在任何设备上通过单个搜索界面进行操作;
③最大化图书馆馆藏的价值;
④扩大图书馆资源的利用,提高图书馆服务的可视性,并通过高级分析向决策者展示价值;
⑤支持图书馆学;
⑥通过端到端库工作流以及先进的收集和规范化功能来提高生产力,轻松定制Primo发现服务以影响探索和显示收藏集的方式;
⑦将发现嵌入学术生态系统;
⑧通过Primo的现成产品集成和开放的API,将发现与研究系统、教学平台、学生移动应用程序和其他工具联系起来。
(4)CDI
2019年4月29日,ProQuest的子公司Ex Libris宣布创建中央发现索引(CDI),这是一个强大而全面的内容索引,它将扩展Ex Libris Summon发现服务的功能和Primo。CDI将在这两种服务中丰富用户的发现经验,从而使图书馆能够通过以人工智能为指导的智能发现服务更好地满足研究人员的需求。
发现环境发展迅速,内容索引需要涵盖越来越多的新材料和资源类型。通过其先进的设计,CDI将允许使用Primo和Summon的图书馆在保持数据质量和内容中立性的同时,应对新的发现挑战。根据Primo和Summon发现服务的开发计划,统一索引将使这两种服务的客户都可以从更快的更新周期、改进的内容提要、更好的相关性评级和独特的内容激活中受益。
CDI也将有助于开发新的以用户为中心的服务,这将改善发现和对图书馆馆藏的访问。新的中央发现索引旨在为所有客户提供稳定且同质的更新。
CDI将从2019年第三季度开始逐步启动,大多数Summon和Primo客户将能够在2020年享受其好处。借助CDI,Ex Libris将更新当前在两种交付服务中使用的基础设施。有关CDI的更多信息,可以在Ex Libris知识中心的Summon CDI Overview和Primo CDI Overview文章中找到。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。