空间统计学(spatial statistics)依靠有序的模型描述无序事件,根据有限信息来分析、评价和预测空间数据(Cressie,1991),一直是有效地综合分析数值型空间数据的普遍方法(Zeitouni,2002)。空间统计学基于足够多的样本给出空间现象的现实模型,运用空间自协方差结构、变异函数或与其相关的自协变量或局部变量值的相似程度,在统计空间对象的几何特征量的最小值、最大值、均值、方差、众数或直方图的基础上,可以得到空间对象特征的先验概率,进而根据领域知识发现共性的几何知识。
空间统计学用随机模型将区域化变量和随机性联系在一起,认为区域化变量是某个随机函数的实现,拥有较强的理论基础和大量的成熟算法,把图像看作区域化变量,用数学模型描述纹理,设置不同的纹理模型参数,借助变差函数分析其结构,可以获得期望的纹理。例如,缺失数据的替代(Addink and Stein,1999)、图像信噪比估计(Smith and Curren,1999),分类(Alkinson and Lewis,2000)、各向异性的遥感图像纠正(Collins and Woodcock,2009)、半参数模型非线性预测(Costa et al.,2010)、火车车轮异常识别(马洪超,2012)。
空间统计学拥有较强的理论基础和大量的成熟算法,能够改善空间数据挖掘对随机过程的处理,估计模拟决策分析的不确定性范围,分析空间模型的误差传播规律,有效地综合处理数值型空间数据,分析空间过程,预计前景,并为分析连续域的空间相关性提供理论依据和量化工具等。所以空间统计学是基本的数据挖掘技术,尤其是多元统计分析(如主成分分析、因子分析、相关分析、多元回归分析等)。由于大部分空间数据挖掘的研究偏重于提高静态数据查询的效率,基于统计信息,研究了一种由用户定义的主动空间数据挖掘的方法。应用空间统计学的克吕格方法,可以从图像上获取类别变量在任一位置上所观测到的各类别的分类概率知识。(www.xing528.com)
但是,空间统计学的数据不相关假设,第一,在空间数据库或空间数据仓库中常常难以得到满足;第二,它能够有效地处理数值型数据,却难以分析字符型数据;第三,如果一个区域的数据受到其相邻区域特征的影响,统计者可能会采用回归模型分析独立变量的滞后形式;第四,在应用空间统计学时,需要同时具备空间领域知识和统计学知识。第五,空间统计分析的计算量也过大。同时,当非匀质空间对象的什么属性可能发生,却难以构建其概率分布模型时,将空间统计学和其他方法(如模糊集)结合,更有利于发现隐藏在这种不确定性中的知识。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。