首页 理论教育 高校图书馆异构数据整合实践

高校图书馆异构数据整合实践

时间:2023-11-05 理论教育 版权反馈
【摘要】:基于信息的异构数据整合模式基于数据的整合通过一定的标准和技术实现了异构异质资源物理或逻辑上的集中与互联互通,实现了多种资源的“一站式”检索,但并没有对数据对象之间的关系进行有效揭示和组织。基于本体的异构数据整合模式本体是特定领域内概念及概念间关系的形式化定义。

高校图书馆异构数据整合实践

经过近几年的发展,异构资源整合无论是在技术上还是在方法上都比较成熟,整合方式也具有多样性,业内已有很多典型案例可供参考,如著名的Europeana资源整合模式,使用EDM数据模型,整合欧洲不同图书馆博物馆、档案馆的文化历史资源,建立了统一资源服务平台。常见异构资源整合模式主要有3种:基于数据的异构数据整合模式、基于信息的异构数据整合模式、基于本体的异构数据整合模式,而基于GIS的异构数据整合模式是在本体及关联数据技术的基础上发展起来的异构数据可视化整合模式。

(1)基于数据的异构数据整合模式

基于数据的整合就是对异构资源系统中的异质、异类的数据库在逻辑上或物理上有机地集中,提供统一的表示和操作,以解决多种异构数据资源的互联与共享。该整合方式实现了异构数据源的集中式管理和分布式存储,用户提出一个查询请求,该模式的查询机制能够在多个空间数据库源进行检索,并将查询结果在统一的输出界面显示出来,实现无缝查询输出。运用的典型技术有CrossRef的DOI技术、基于OpenURL的SFX技术,以及目前较为热门的Web Service技术。

(2)基于信息的异构数据整合模式

基于数据的整合通过一定的标准和技术实现了异构异质资源物理或逻辑上的集中与互联互通,实现了多种资源的“一站式”检索,但并没有对数据对象之间的关系进行有效揭示和组织。在泛在信息环境下,用户希望能在一个统一的入口实现“一站式”检索,又能够“一步到位”地获取多种关联资源。这就需要对信息实体关系进行有效组织和整合。基于信息的整合在数据整合的基础上,实现了信息间实体关系的整合,整合方式主要是基于信息门户的整合。该整合方式在数字图书馆领域具有广泛的实践范例,如圣卡塔琳娜州联邦大学的硕博论文数字图书馆、ETANA考古数字图书馆等。(www.xing528.com)

(3)基于本体的异构数据整合模式

本体(Ontology)是特定领域内概念及概念间关系的形式化定义。基于信息的整合实现了信息实体间关系的整合,但没有对信息实体内部概念和语义进行揭示。基于本体的整合对信息实体中的内在概念及概念之间的关系进行表征分析。本体技术的发展,为异构资源整合提供了强有力的工具。其中,本体是整合的核心。许多学者提出运用本体工具来解决历史地理信息的异构问题,如运用统一本体去丰富概念框架,从而促进数据集成度的提高和查询过程的优化。本体采用了面向对象的思想,具备了良好的可扩展性,又有W3C等机构推动相关标准规范和应用指南的制定,并能很好地结合语义网和关联数据技术,具备了良好的开放性,近年来成为一种有效的知识组织方法,广泛地应用于数据建模。

(4)基于GIS的异构数据整合模式

地理信息系统(Geography Information System,GIS)常应用于历史地理资源的整合,即以GIS为整合平台,整合多个专题数据库资源。基于GIS的整合利用历史地理资源特有的空间地理属性,在同类主题的异构资源间建立联系,实现异构资源的统一检索、可视化呈现。其特征有两个。第一,异构数据源的集中式管理和分布式存储。GIS系统分别对异构数据源中共有的空间地理核心元素进行采集,在逻辑上有机地集中,实现多种异构资源的互联与共享,构建GIS核心元数据集。用户提出一个GIS数据请求,GIS系统在多个数据源进行检索查询,并将查询结果在统一的GIS平台输出。第二,利用关联数据技术实现异构数据源的语义化集成。关联数据在语义网中使用统一标识符(Uniform Resource Identifier,URI)和RDF发布结构化数据,是构建数据间链接的最佳实践方式。基于异构数据源共有核心元素,通过选取适合具体应用场景的词表建立共享核心元数据本体,实现异构元数据间的语义整合和互操作;通过定制化扩展共享核心元数据本体,建立专门的元数据本体,实现特定资源语义化描述。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈