【摘要】:数据分析与数据挖掘紧密相连,具有循环递进的关系。数据分析结果需要进一步进行数据挖掘才能指导决策,而数据挖掘进行价值评估的过程也需要调整先验约束而再次进行数据分析。数据分析可以更有效地促进数据挖掘,数据挖掘又有利于提高数据分析的准确性。两者的具体区别主要在于:在数据量上:数据分析的数据量可能并不大,而数据挖掘的数据量极大。
数据分析可以分为广义的数据分析和狭义的数据分析,我们常说的数据分析就是指狭义的数据分析,而广义的数据分析则包括狭义的数据分析和数据挖掘。
数据分析与数据挖掘紧密相连,具有循环递进的关系。数据分析结果需要进一步进行数据挖掘才能指导决策,而数据挖掘进行价值评估的过程也需要调整先验约束而再次进行数据分析。数据分析可以更有效地促进数据挖掘,数据挖掘又有利于提高数据分析的准确性。两者的具体区别主要在于:
在数据量上:数据分析的数据量可能并不大,而数据挖掘的数据量极大。
在约束上:数据分析需要对数据分布和变量间的关系做假设,确定用什么概率函数来描述变量间的关系,以及如何检验参数的统计显著性,建立方程或模型来与假设吻合。而数据挖掘不需要对数据分布做任何假设,能通过算法自动寻找变量间的关系。(www.xing528.com)
在应用上:数据分析倾向于业务层面,对结果进行解释,得出有效信息;而数据挖掘更关注技术层面,对信息进行价值评估,着眼于预测未来。
如第一章所提到的啤酒与尿不湿案例,数据分析就是基于历史销售数据,得出购买不同商品的人各自具有的特征。数据挖掘就是基于历史销售数据,使用关联分析找到买啤酒的人还会经常购买尿不湿的规律。也就是说,数据分析是把数据变成信息的工具,数据挖掘是把信息变成认知的工具,如果我们想要从数据中提取一定的规律,往往需要结合数据分析和数据挖掘使用。
目前,数据分析与数据挖掘从概念的提出到理论的完善再到算法的成熟,逐步形成了一套完整的体系,并成功应用在许多领域,不断改变着人们的生产生活方式,在下一章将就其应用进行详细描述。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。