ODS可以有两种形式:ODS数据缓冲区和ODS统一信息视图区。
(1)ODS数据缓冲区
ODS数据缓冲区是业务数据流动过程的第一个存储区,实现了数据仓库从各个业务系统的数据源中将数据抽取出来,并且装载到ODS数据缓冲区的这一过程,从而实现统一的、全局的企业数据平台,为以后的数据抽取、清洗、转换过程打下了坚实的基础。对于数据量大的数据源可以采用增量的方式进行抽取,对于经常变化更新的数据一般采用全量的方式进行抽取。ODS数据缓冲区具有实时性的特征,ODS系统将各个孤立的业务系统的生产运营数据集成起来,组成统一的、全局的企业数据交换平台。ODS数据缓冲区与业务数据的关系如图3-31所示。
图3-31 ODS数据缓冲区与业务数据的关系
(2)ODS统一信息视图区
ODS统一信息视图区是指有选择地集成各类业务源数据,对数据进行抽取、清洗、转换操作,以数据主题域为数据集成的基础,对数据进行分类和组织,使用户能够通过统一信息视图区获得跟某个主题域相关的实时性数据。各业务系统和ODS统一信息视图区可以互相访问,可以生成具有实时性的操作性报表和查询某一主题的近期全部信息。ODS统一信息视图区与各业务系统之间的关系如图3-32所示。(www.xing528.com)
图3-32 ODS统一信息视图区与各业务系统之间的关系
(3)ODS数据缓冲区和ODS统一信息视图区的区别和共同点
ODS数据缓冲区主要为业务源数据抽取到数据仓库中提供中间数据缓冲的功能,与ODS统一信息视图区最大的区别就是数据抽取、清洗、转换、加载的转换规则和数据存储的方式不同。ODS统一信息视图区是完全按照主题的方式进行数据存储,向用户提供快速的报表展示和数据实时查询的功能。而ODS数据缓冲区的ETL规则一般只进行简单的汇总、计算,或者从操作型数据库中直接抽取而中间不进行任何转化。ODS统一信息视图区的数据一般都是从ODS数据缓冲区中抽取过来的。ODS数据缓冲区和ODS统一信息视图区如图3-33所示。
图3-33 ODS数据缓冲区和ODS统一信息视图区
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。