书目数据是图书馆开展服务的基础,也是图书馆最宝贵的数据财产。随着关联数据技术、工具和流程的日渐成熟,越来越多的图书馆开始将其馆藏书目数据发布为关联书目数据。2015年,OCLC开展了关联数据项目调查,共反馈得到90个机构156个项目,在有详细描述的112个项目中就有56个关联书目数据项目。而由Zepheira公司主导的Library.Link项目,参与的机构更是达到了上千家。
大英图书馆(BL)在2011年7月开始将图书和连续出版物数据发布为关联数据,在2017年又新增了CIP数据。BL发布关联数据一方面是响应英国政府的开放数据政策,另一方面也是为了探索关联书目数据的应用可能性。BL在复用Bibo、DC、RDA、Event等本体词表基础上,自定义本地词表British Library Terms,并设计了适用于所发布三种类型文献的大英图书馆数据模型(British library data model)。链接的外部数据集有ISNI、VIAF、LCSH、GeoNames等。其消费方式有SPARQL endpoint和RDF数据包下载,支持JSON、XML、Turtle等序列化格式。在2014年4月到2015年4月的关联数据利用统计中,来自搜索引擎与关联数据爬虫的访问就达到了4 300万次,数据包下载平均每月也有40次。
法国国家图书馆关联数据项目(BnF)不仅仅是发布关联书目数据集,还通过data.bnf.fr为普通读者提供统一的检索服务。BnF利用FRBR模型建立“作品”“主题”“作者”之间的关系,并复用skos、foaf、dcterms、RDAgroup2elements、rdvocab,自定义了bnf-onto词表。由于其书目数据采用了一套“ARK”永久标识符,且挂接到规范数据,解决了MARC到RDF数据转换中实体识别这一大难点。BnF链接的外部数据集有VIAF、DBPedia、Agrovoc、id.loc.gov等。以HTML、JSON、RDF或PDF等格式发布,通过SPARQL endpoint、FTP下载对外提供数据服务,也在HTML页面中嵌入了Schema.org和Opengraph Protocol词表以提高对搜索引擎的友好性。data.bnf.fr在2012年底上线仅一年时进行的访问统计就显示出了关联数据的优势,一年内个人访问量增长了600%,页面点击量增长了400%。其中80.6%的访问者是通过搜索引擎跳转而来,有71.9%的访问者会跳转到图书馆其他服务的页面。
美国国会图书馆(LC)自2009年开始将其规范数据、术语词表、MARC代码和取值词表发布为关联数据。LC于2012年启动了“书目框架转换行动”,开发BIBFRAME关联数据模型、词表、应用纲要、编码规范等以取代MARC,使其成为下一代的图书馆数据格式,于2017年6月使用BIBFRA.ME数据模型在Library.Link中发布。在此过程中,LC开发了数据转换工具Marc2Bibframe、数据编辑工具BIBFRAME Editor等工具,并发布了BIBFRAME应用纲要、MARC21字段与BIBFRAME词表映射等文档。BIBFRAME在国际图书馆界得到广泛关注,德国国家图书馆、匈牙利国家博物馆图书馆、意大利联合目录平台SHARE、美国国家医学图书馆、关联数据项目LD4P等,以及上海图书馆都开展了基于BIBFRAME关联数据项目的研究和应用。(www.xing528.com)
韩国国家图书馆(NLK)、日本国立国会图书馆(NDL)也都在探索本国关联书目数据和关联规范数据的发布。NLK在2011年开始将其书目和规范数据发布为关联数据,以SPARQL endpoint和API的形式提供RDF、JSON等格式的数据服务。NDL则在2012年发布了关联数据服务平台NDL Search。开放的数据包括了NDL-OPAC、日文期刊索引数据、NDL数字资源,以及其他图书馆的电子档案等。NDL还利用API接口,为开发者提供基于DC-NDL词表描述的RDF和JSON格式的数据。
OCLC WorldCat作为世界最大的联合目录,自2014年开始利用Schema.org词表对亿级书目数据进行语义化改造。在其2015年的使用统计中,平均每天的请求量就达到了1 600万。OCLC的另一个达到百万级访问量的关联数据项目,就是虚拟国际规范档。虚拟国际规范档不仅外链了DBPedia、ISNI、Getty、id.loc.gov等多个数据集,也被大量其他的关联数据集所链接。虚拟国际规范档提供了MARC和RDF两种类型的数据格式。除了这两个项目,OCLC还利用规范MARC数据发布了作品实体和主题词分面应用两个关联数据集。
欧洲数字图书馆(Europeana)是数字图书馆领域最成功的项目之一。它是由欧洲各国图书馆、档案馆、博物馆等文化遗产机构共同参与的大型合作联盟。Europeana通过关联数据模型(Europeana data model)对跨机构、跨领域的多类型资源进行语义描述,最终以关联开放数据对外发布,并支持批量下载、API、SPARQL endpoint等方式提供数据服务。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。