【摘要】:数据的挖掘是指通过分析已采集的数据,寻找数据背后隐藏的信息。另外,随着生产能力的增强,硬件成本也逐渐降低,使得大量使用硬件的要求得到满足,为数据挖掘提供了硬件支持。
数据的挖掘是指通过分析已采集的数据,寻找数据背后隐藏的信息。对于数据挖掘,一种比较公认的定义是W.J.Frawley、G.Piatetsk Shapiro等人提出的:数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的信息,提取的知识表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。
1.数据挖掘技术
目前常用的数据挖掘方法对计算机的依赖非常严重。有些20世纪提出来的算法,由于计算过程太过复杂而被边缘化,随着计算机技术的不断进步、计算能力的不断增强,又重新被人们利用起来,比如神经网络、支持向量机、决策树、随机森林等算法。另外,随着生产能力的增强,硬件成本也逐渐降低,使得大量使用硬件的要求得到满足,为数据挖掘提供了硬件支持。
通过对数据进行分析,得到的结果往往不够直观甚至难以被理解,这就需要数据的可视化展示,从柱状图、直方图、箱线图、茎叶图(在数据量较大时不适用)、PP图等,到小提琴图、热度图、词云图等。通过将数据形象生动地展示出来,其中的规律往往能够得到更通俗的体现。(www.xing528.com)
2.数据挖掘工具
数据挖掘的过程中使用的工具种类复杂多样,根据各个行业的不同特点等也有不同的使用倾向。在金融行业,常使用的专业工具包括Python、R语言、SAS、MATLAB等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。