1)数据仓库的定义:数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库是计算机应用发展的必然产物,它搜集了企业相关内部和外部各个系统的数据源、归档文件等一系列历史数据,包括大量原始数据、业务数据,该系统用于构建面向企业管理者的决策支持系统。
2)数据仓库的特点:面向主题的、集成的、稳定的、反映历史变化。
3)数据仓库模型设计:数据模型分为概念模型、逻辑模型、物理模型。概念模型建模的流程大致可以分成如下几个部分:通过对业务系统的详细说明,进行数据的梳理,列出数据主题详细的清单,并对每个数据主题都作出详细的解释,然后再经过归纳、分类,整理成数据主题域,列出每个数据主题域包含哪些部分,并对每个数据主题域作出解释,最后划分成主题域概念模型。逻辑模型是以概念模型为基础,对概念模型的进一步细化、分解。物理模型最终确定数据仓库的表名、列名及相关属性,并生成定义数据库的SQL命令。
4)数据模型是指用实体、属性、实体之间的关系对业务概念和逻辑规则进行统一的定义,命名和编码,主要描述企业的信息需求和业务规则,是业务人员和开发人员沟通的语言,是数据仓库架构设计工作开始的第一步。正确的数据模型是用户需求的集中体现,是商业智能项目成功与否最重要的因素之一。
5)数据仓库开发过程包括:数据仓库规划分析与确定需求,概念模型的开发,逻辑模型的开发,数据仓库体系结构设计,元数据的设计与物理表的实现,数据抽取、转换、加载,数据仓库实施应用,数据仓库维护等过程。
6)数据仓库的价值不在于存储数据量的多少,而是在于用户能从数据仓库中得到的信息和知识。
7)在数据仓库的概念模型中,业务建模主要有两种方式:
●从企业的战略目标出发,结合业务需求和调研的内容,进行自顶向下开发,保证模型不偏离商业智能项目的目标。
●分析现有系统的数据内容,通过归纳和总结,自底向上进行概念模型建设,即从数据的角度去理解业务的需求和规则。(www.xing528.com)
8)模型设计中主要的设计元素有主题、实体、属性、关系。主题是指与业务相关的数据的主要分类。主题域是企业数据的主题的集合,反映了企业数据的子集,主要包含主题、实体、属性以及它们之间的关系,是数据模型中最大的逻辑单位。实体通常是一个人、一个地点或者是一个事件,在实体模型中是唯一的、不可再分的最小逻辑单位。实体一般分成主实体、子实体、属性实体、关系实体。其中主实体是不依赖于其他任何实体而独立存在的实体,如用户实体、产品实体等。子实体是对父实体的逻辑分类,一般继承父实体的所有特征、属性和关系。
9)数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
10)数据仓库和数据集市的区别:数据仓库是面向主题的、集成的数据的集合。而数据集市通常被定义为星型结构或者雪花型数据结构,通常由一张事实表和几张维表组成。
11)数据仓库实施详细步骤:需求分析、数据仓库的逻辑分析、ODS设计、数据仓库建
模、数据集市建模、数据源分析、数据的获取与整合、应用分析、报表展示。
12)数据仓库在逻辑上可以分成操作型数据库、数据仓库层、数据集市层、数据分析应用层、报表展示层。
13)ODS数据缓冲区主要为业务源数据抽取到数据仓库中提供中间数据缓冲的功能,与ODS统一信息视图区最大的区别就是数据抽取、清洗、转换、加载的转换规则和数据存储的方式不同。ODS统一信息视图区是完全按照主题的方式进行数据存储,向用户提供快速的报表展示和数据实时查询的功能。而ODS数据缓冲区的ETL规则一般只进行简单的汇总、计算,或者从操作型数据库中直接抽取而中间不进行任何转化。
14)数据仓库的主要作用。数据仓库主要有3个方面的作用:利用最宝贵的业务数据作出最明智的商业决策、支持多维分析、分析和预测功能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。