商务智能作为一套完整的解决方案,它是将数据仓库、联机分析处理和数据挖掘等结合起来应用到商业活动中,从不同的数据源收集数据,经过抽取、转换和加载的过程,送到数据仓库或数据集市,然后使用合适的查询与分析工具、联机分析处理工具和数据挖掘工具对信息进行再处理,将信息转变为辅助决策的知识,最后将知识呈现于用户面前,以实现技术服务于决策的目的。商务智能主要由数据仓库、联机分析处理和数据挖掘这3种技术构成。
(1)数据仓库
数据仓库(DataWarehouse)的概念始于20世纪80年代中期,在业内被广泛接受的定义是由号称“数据仓库之父”的比尔·恩门(Bill Inmon)在《建立数据仓库》一书中提出来的,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合”。数据仓库是用以支持经营管理中的决策制定过程,与传统数据库的面向应用相对应。
可以从两个层次来理解数据仓库的概念,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于组织现有的操作型数据库;其次,数据仓库是多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
(2)联机分析处理
联机分析处理(On-line Analysis,OLAP)是与数据仓库技术相伴而发展起来的,作为分析处理数据仓库中海量数据的有效手段,它弥补了数据仓库在直接支持多维数据视图方面的不足。目前关于联机分析处理的概念还没有达成共识,OLAP委员会给出了较为正式和严格的定义:OLAP是一类软件技术,它使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的,并真实反映企业维持性的信息进行快速、一致、交互地存取,以便管理决策人员对数据进行深入观察。
从定义可以看出联机分析处理是根据用户选择的分析角度,快速地从一个维转变到另一个维,或者在维成员之间比较,使用户可以在短时间内从不同角度审视业务的状况,以直观的方式为管理人员提供决策支持。
(3)数据挖掘(www.xing528.com)
“数据挖掘”(Data Mining)一词是在1989年8月于美国底特律市召开的第11届国际联合人工智能学术会议上正式提出的,与知识发现(Knowledge Discovery in Database,KDD)混用。从1995年开始,每年一次的KDD国际学术会议将KDD和数据挖掘方面的研究推向了高潮。从此,“数据挖掘”一词开始流行。
数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等,它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。
数据挖掘技术融合了多个不同学科的技术与成果,一开始就是面向应用的,不再是面向特定的数据库进行简单的检索、查询调用,而是对数据进行统计、分析、综合和推理。数据挖掘是一门广义的交叉学科,是多种技术综合的结果,数据挖掘方法是由人工智能、机器学习的方法发展而来,结合传统的统计分析方法、模糊数学方法及可视化技术,以数据库为研究对象,形成了数据挖掘的方法和技术。
作为商务智能的三大支柱技术,数据仓库、联机分析处理和数据挖掘三者之间存在着千丝万缕的联系。
首先,它们的共同点在于:三者都是从数据库的基础上发展起来的,都是决策支持技术。其中,数据仓库是利用综合数据得到宏观信息,利用历史数据进行预测;联机分析处理技术是在关系数据库的基础上发展起来的,其利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析和可视化工具对这些数据迅速进行评价,将复杂的分析查询结果快速地返回给用户,以支持决策;数据挖掘是从数据库中挖掘知识,也用于决策分析。
其次,三者之间也有差别。数据仓库是商务智能的基础,主要用于存储相关数据,属于商务智能数据仓库环境部分,而联机分析处理与数据挖掘都是数据仓库的分析工具,属于商务智能数据分析环境部分。进一步来看,联机分析处理与数据挖掘的区别在于:联机分析处理是建立在多维视图的基础上,强调执行效率和对用户命令的及时响应,而且其直接数据源一般是数据仓库;而数据挖掘是建立在各种数据源的基础上,重在发现隐藏在数据深层次的对人们有用的模式并作出有效的预测性分析,一般并不过多考虑执行效率和响应速度,可见,从对数据分析的深度来看,联机分析处理位于较浅的层次,而数据挖掘所处的位置则更深,数据挖掘可以发现联机分析处理不能发现的更复杂而细致的信息。尽管数据挖掘与联机分析处理存在以上差异,但是同作为数据仓库系统的工具层的组成部分,两者是相辅相成的。
由此可见,数据仓库拥有丰富的数据,但只有通过联机分析处理和数据挖掘才能使数据变成有价值的信息,才能体现出数据仓库的辅助决策功能,否则永远都是数据丰富但信息匮乏;反之,尽管联机分析处理和数据挖掘并不一定要建立在数据仓库的基础上,但数据仓库却能提高两者的工作效率,使之有更大的发展空间。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。