首页 理论教育 数据挖掘的定义-基于大数据挖掘的服刑人员再犯罪预测 成果

数据挖掘的定义-基于大数据挖掘的服刑人员再犯罪预测 成果

时间:2023-07-31 理论教育 版权反馈
【摘要】:在大数据时代,数据挖掘的对象——数据有了新的特征,由此,大数据挖掘被赋予了新的含义,也产生了新的挖掘算法和模型。大数据挖掘是指从大数据集中寻找其规律的技术[5]。

数据挖掘的定义-基于大数据挖掘的服刑人员再犯罪预测 成果

1.数据挖掘的定义

百度百科的定义:数据挖掘(Data Mining),又译为资料探勘、数据采矿。它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标[1]。将数据挖掘定义为:从数据库的大量数据中挖掘出有用的信息,即从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的过程。[2]

一些人把数据挖掘和数据库中的知识发现(Knowledge-Discovery in Databases,简称:KDD)等同,认为数据挖掘就是知识发现。而另一些人只是把数据挖掘看作是知识发现过程[3]的一个步骤,前者是对数据挖掘的广义定义,后者是对数据挖掘的狭义定义。然而,在产业界、研究界,数据挖掘通常用来表示整个知识发现过程,因此,我们采用广义的数据挖掘功能观点:数据挖掘是从大量的数据中挖掘有趣模式和知识的过程[4]。数据源包括数据库、数据仓库、Web、其他信息存储库和动态地流入系统的数据。(www.xing528.com)

2.大数据挖掘的定义

由于大数据存在海量、复杂、高维、多变等特点,怎样从客观原始、凌乱、无序、复杂的海量数据中挖掘出人类感兴趣的知识,迫切需要大数据理论进行指导。由于现有的数据挖掘算法大部分是基于内存的,而大数据由于数据量大是无法全部装载到计算机内存里的,因此如何改进、设计新的算法来适应大数据处理的需求,是大数据时代的研究热点之一。在大数据时代,数据挖掘的对象——数据有了新的特征,由此,大数据挖掘被赋予了新的含义,也产生了新的挖掘算法和模型。大数据挖掘是指从大数据集中寻找其规律的技术[5]。这个定义将大数据挖掘的对象扩展为大数据集,而大数据集中既包括传统关系数据库中的结构化数据,也包括半结构化和非结构化数据;大数据集中既包括历史数据,也包括实时的数据流。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈