由于整合异构特藏资源的目的是为人文研究提供支持,需要在数据的基础上提供知识发现作用,因此在综合考虑整合方法的基础上,拟采用物化的数据仓库法进行整合,即对元数据进行收割集中储存,其系统架构如图7-3所示。对于已经编目且存储于类似于MySQL、MSSQL及Oracle的元数据,借鉴DPLA整合模式,使用OAI协议。师范联盟各成员馆是OAI协议中的数据提供方,本馆是OAI协议中的服务提供方。首先要求数据提供方按照服务提供方要求的元数据格式进行编目。本馆利用OAI收割器生成请求,通过HTTP协议的GET或POST方法向数据提供方发送OAI请求,数据提供方按照请求将数据返回给本馆,从而完成元数据的收割。对于未在集成系统内进行编目,以Excel、XML文件存储的元数据,数据提供者可使用FTPS方式直接将元数据提交给本馆。本馆在获得元数据后,对数据进行去重、清洗、转换、合并和融合等加工处理存储于核心数据库中。在将采集来的元数据存于数据库之后,一方面要识别元数据的实体,构建知识本体。在知识本体的构建过程中应遵循尽量复用已有的知识本体与术语词表。目前国际上通用流行的词表有DC/DCT、Schema.org、BIBFRAME、RDA、EDM等。选定合适的词表后,从核心元数据出发,将元数据项与词表中的类相对应,并以属性来明确类与类之间的关系,从而形成立体网状模型。本体构建完成以后使用RDF格式编码,存储于专用的RDF存储库中,发布为关联数据,实现与外部世界的自动关联、复用、共享。另一方面,要在核心数据库基础上构建数字人文系统平台,借鉴CBDB、CHGIS和上海图书馆家谱知识服务平台等数字人文系统。平台提供统一的检索功能,基于GIS技术动态显示资源信息;拥有基于GIS的时空分析功能;提供编辑入口以众包平台方式让使用者参与资源的共建;提供开放数据下载功能;提供API接口供其他程序调用;使用IP控制,供有权限的用户浏览全文等。其功能丰富,能够实现资源长期保存、共享及拓展。
图7-3 基于师范联盟异构特藏资源的数字人文系统架构图(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。