首页 理论教育 异构数据的集成-智能信息处理技术

异构数据的集成-智能信息处理技术

时间:2023-11-19 理论教育 版权反馈
【摘要】:包括数据完整性和约束完整性两方面。数据完整性是指完整提取数据本身;约束完整性是指数据与数据之间的关联关系。目前学者使用的异构数据集成主要有以下一些方法:1)基于元数据的异构数据集成。首先,根据现有数据集的情况,制定元数据规范。实现元数据的共享、查询和集成[21]。2)基于XML的异构数据集成。最后,加载标准化数据,完成异构数据的共享集成[20]。3)基于WCF的异构数据源集成。

异构数据的集成-智能信息处理技术

在处理异构数据集成的时候,应考虑以下问题:

1)异构性。异构性是数据集成首先要考虑的问题,主要体现在系统和模式上的异构。系统异构是指操作系统、应用系统及数据库管理系统之间的不同;模式异构是指数据源存储在不同的模式上。

2)完整性。包括数据完整性和约束完整性两方面。数据完整性是指完整提取数据本身;约束完整性是指数据与数据之间的关联关系。

3)语义冲突。信息资源之间存在着语义上的区别。这些语义上的不同可能会引起各种矛盾,如命名冲突、度量值冲突和数据类型冲突等。

4)数据冗余。指对于同一个客观事物在不同的数据源中存在两个或两个以上完全相同的描述。

5)不一致性。指多个应用系统之间由于数据的重复或冗余,在实际使用过程中,会造成数据信息更新不同步,从而引起数据的不一致。

6)安全性。由于数据资源可能归属于不同的单位,所以如何在访问异构数据源数据基础上保障原有数据的权限不被侵犯,实现对原有数据源访问权限的隔离和控制,已经成为连接异构数据源所必须解决的问题。(www.xing528.com)

目前学者使用的异构数据集成主要有以下一些方法:

1)基于元数据的异构数据集成。首先,根据现有数据集的情况,制定元数据规范。即定义标识符、语种、字符集、联系方信息、创建日期、版本、数据集信息和Web Service接口等信息。其次,不同应用系统建立不同的元数据,每一条元数据对应一个数据集。再次,应用系统向外部提供元数据和实体数据的访问方式。最后建立统一的用户入口。实现元数据的共享、查询和集成[21]

2)基于XML的异构数据集成。首先,使用JDBC接口获取数据库的基本信息以及表中字段信息。其次,与预定义的标记模块结合生成标准的XML文档及相应的模式,完成数据到XML文档的映射,即实现了统一的数据转换模式。最后,加载标准化数据,完成异构数据的共享集成[20]

3)基于WCF的异构数据源集成。首先使用WCF技术以及基于事件驱动和构件化方法实现不同开发语言之间的操作。其次,使用XML完成数据统一格式的转换问题。最后传播数据[22]

数据集成技术,大大解决了不同数据源中大量数据的“信息孤岛”问题。为处理复杂、异构的系统提供了方便、有效的解决方案。随着技术的发展,相信还会出现越来越多、越来越高效的处理方法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈