数据挖掘技术也叫作知识发现,所谓数据挖掘就是从大量数据中发现对人们有价值的概念、模式和规律等,它是一个揭示出隐含的、先前未知的并有潜在价值的信息的过程。它是一门交叉科学,主要涉及数据库技术、人工智能、机器学习、统计学、信息检索和模式识别等领域,有十分广阔的应用前景。随着物联网的发展,数据挖掘技术也必然会在物联网中得到广泛运用。一个完整的数据挖掘过程,是个很庞大的系统,主要结构如图6-29所示,主要分为以下几个部分:
1)确定业务对象。在进行数据挖掘之前,最重要的一步就是要明确业务问题并且弄清数据挖掘的目的,然后再找数据的来源。数据挖掘的来源很多,只要具备大量数据的来源都可以进行挖掘,虽然最后的结构是不可预测的,但要探索的问题必须是可以预见的,否则进行数据挖掘时是不会成功的。
图6-29 数据挖掘系统结构
2)数据预处理。由于数据的来源很多,其中包含很多的数据信息,在确定了数据来源后,必须首先对数据信息进行数据预处理。数据预处理一般包括数据清理、数据集成、数据变换和数据规约4个处理过程。
3)数据的转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。(www.xing528.com)
4)数据挖掘过程。对所得到的经过转换的数据进行挖掘,除了进行完善并选择合适的挖掘算法外,其余一切工作都能自动地完成。
5)模式评估。解释并评估结果,其使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术。根据某种兴趣度量,识别表示知识的真正有用的模式。
6)知识的同化。使用可视化和知识表示技术,向用户提供挖掘的知识。
7)用户界面。最后需要将数据挖掘的结果展示给用户,提供给用户适当的操作界面进行操作,以得到相关的结果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。