首页 理论教育 数据挖掘:从数据集中提取信息的建模分析

数据挖掘:从数据集中提取信息的建模分析

时间:2023-06-27 理论教育 版权反馈
【摘要】:数据挖掘又称为资料探勘、数据采矿,是一个跨学科的计算机科学分支。数据挖掘是数据库知识发现中的一个步骤,主要目标是从一个数据集中提取信息,并将其转换成可理解的结构,便于进一步使用。典型的数据挖掘主要包括以下四个流程:首先,提出问题。从流程来看,数据挖掘在本质上就是建模,即发现客观事物的规律。

数据挖掘:从数据集中提取信息的建模分析

数据挖掘又称为资料探勘、数据采矿,是一个跨学科的计算机科学分支。它是用人工智能、机器学习统计学数据库的交叉方法,从数据库中的大量数据揭示隐藏的、未知的,且具备较大潜在价值的信息的技术筛选过程。

数据挖掘是数据库知识发现中的一个步骤,主要目标是从一个数据集中提取信息,并将其转换成可理解的结构,便于进一步使用。常用算法包括分类法、聚类法、神经网络法、遗传算法决策树法、模糊集等。典型的数据挖掘主要包括以下四个流程:

首先,提出问题。在理解数据和实际问题的基础上提出问题,确定研究目标。

其次,数据取样。获取原始的数据,经过数据治理后,选择与数据挖掘有关的变量,或者转换变量,再从中抽取与问题有关的数据样本集,并建立数据(仓)库进行存储。(www.xing528.com)

再次,构建模型。根据数据挖掘的目标和数据的特征,应用分析软件工具建立合适的模型,对数据样本集进行探索和预处理,寻找出期望的关系和未知的模式。

最后,评价结果。结合专业知识对挖掘结果进行解释,评价其有效性和可靠性,并应用于解决实际问题。

从流程来看,数据挖掘在本质上就是建模,即发现客观事物的规律。但与传统建模最大的区别在于,数据挖掘的模型是自动化的或半自动化的;而传统建模是人工的,需要技术人员根据自己对客观世界的认识,并结合一定领域的知识,调动智慧,发挥主观能动性去建立模型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈