首页 理论教育 空间数据挖掘:发现真实大量的知识模式

空间数据挖掘:发现真实大量的知识模式

时间:2023-05-18 理论教育 版权反馈
【摘要】:②空间数据挖掘的数据源是真实的、大量的、含噪声的,早已以电子形式存储在空间数据库中。③空间数据挖掘是发现而不是证明。空间数据挖掘的多个步骤之间互相影响、反复调整、螺旋上升,从数据集中挖掘以模式来表示的知识。④空间数据挖掘所发现的知识都是面向具体领域的,具有特定的前提约束条件和相对性。发现的空间知识可以被用于信息管理、查询优化、决策支持和过程控制等,还可以用于数据自身的维护。

空间数据挖掘:发现真实大量的知识模式

空间数据挖掘(spatial data mining,SDM),也称基于空间数据库的数据挖掘和知识发现(spatial data mining and knowledge discovery),作为数据挖掘的一个新的分支,是指从空间数据库中提取隐含其中、事先未知、潜在有用、最终可以理解的空间或非空间的一般知识规则的过程(Koperski et al.,1996;Ester et al.,2000;Miller&Han,2001;王树良,2006)。因此空间数据挖掘就是在空间数据库的基础上,综合利用统计方法和智能算法从大量含有噪声、不确定性的空间数据中提取人们可信的、新颖的、感兴趣的、隐藏的、事先未知的、潜在有用的和最终可理解的知识,揭示蕴含在数据背后的客观世界的本质规律、内在联系和发展趋势,实现知识的自动获取,为决策提供不同层次的知识依据。

可见空间数据挖掘和知识发现的过程大致可分为以下多个步骤:数据准备、数据选择、数据预处理、数据缩减或者数据变换、确定数据挖掘目标、确定知识发现算法、数据挖掘、模式解释、知识评价等,而数据挖掘只是其中的一个关键步骤。但是为了简便,人们常常用空间数据挖掘来代替空间数据挖掘和知识发现。空间数据挖掘具有以下基本特性:

①空间数据挖掘的目的在于从空间数据库或空间数据仓库中提取事先未知且潜在的有用的空间规则、概要关系、摘要数据特征、分类概念描述或偏差检测等知识,是一种决策支持过程,尚有含噪声、信息冗余和数据量超大等技术难点需要解决。

②空间数据挖掘的数据源是真实的、大量的、含噪声的,早已以电子形式存储在空间数据库中。原始空间数据可以是结构化的数据,如关系数据库中的数据,也可以是半结构化的数据,如文本数据、图形数据、图像数据以及分布在网络上的异构型数据。数据源支持相应的发现,但发现的知识是隐含的,事先并不知道。(www.xing528.com)

③空间数据挖掘是发现而不是证明。发现是自动的或至少是在计算机辅助下的交互半自动的。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。空间数据挖掘的多个步骤之间互相影响、反复调整、螺旋上升,从数据集中挖掘以模式来表示的知识。

④空间数据挖掘所发现的知识都是面向具体领域的,具有特定的前提约束条件和相对性。不要求发现放之四海皆准的知识,也不是要去发现崭新的科学定理或纯数学公式,仅支持特定的空间问题(李德仁,2005)。发现得到的是人们感兴趣的非外在存储的知识、空间关系或其他有兴趣知识,同时还要易于接受、理解和应用,最好能够用包括自然语言在内的多种方式表示发现的过程和结果。发现的空间知识可以被用于信息管理、查询优化、决策支持和过程控制等,还可以用于数据自身的维护。例如为理解土地利用数据,发现土地利用的规律、模式和空间对象之间的关系,整合土地利用数据库,优化空间查询,为实现土地资源管理和决策的智能化、集成化等提供知识指导和保障。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈