1.空间关联规则知识获取与表达
土地用途分区所涉及的知识可以分为领域知识和空间关联知识两类。传统的知识工程技术,典型方法包括与专家会谈、通过已知内容学习、通过观察学习(高文秀,2004)、资料分析、机器学习人工神经元网络智能增强法(amplified intelligence)。在实际应用中常需要上述多种方法联合以最大限度地获取综合所需的知识(Weibel,1995)。如果将传统的方法应用到地理信息领域,则必须对传统的知识工程方法进行精练和扩展。本体论作为新型知识库的核心和知识系统之间的知识交换的标准,已在知识工程、自然语言理解、智能信息继承、数据库理论与信息系统等方面得到了广泛的关注。近年来,本体论与GIS的结合研究成为了新的热点。Frank(1997)认为本体论是避免GIS信息不一致发生的基本方法;Smile和Mark(1998)提出本体论为不同领域空间实体的概念化及相互关系提供了平台;Guarino(1998)系统研究了本体驱动的GIS;Fonseca和Egenhofer(2002,2004)在基于本体论的知识模型和方法方面展开了具体的研究;Lars Kulik等(2005)针对线要素开展了基于本体的知识获取研究,但缺乏本体驱动的自动知识获取框架和具体算法算子的研究。
空间关联知识的获取主要是通过空间关联规则来实现的。空间关联规则算法研究重在高效、准确地发现并获取多种形式的规则。利用既有的关联规则的挖掘算法,可以挖掘出相应的空间关联规则。空间关联规则的获取比较有效的方法有:搜索算法、层次算法、数据集划分算法、抽样算法等。这些算法是针对非空间关联规则提出的,可以在进行扩展后应用在空间数据挖掘中。可是,传统的方式主要是用数据挖掘的方法研究空间数据挖掘,很少顾及数据的空间特征(Lotfi A.Zadeh,2005)。空间数据的特性不仅包含位置和属性数据,还有实体间空间关系,而且空间数据的结构也比较复杂,既有表格数据,也有矢量数据、栅格数据。由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。一种逐步求精的优化方法可用于空间关联的分析(秦昆,2003),该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次知识获取,然后在裁减过的数据集上用代价较高的算法进一步改进知识获取的质量。国内外学者对空间关联规则挖掘已经开展了相关的研究工作,在基础理论和应用上取得了一定的成果,使得以空间数据库为中心的规则挖掘成为可能,如空间元规则、空间泛化、空间聚类和关联等。如T.Tsegaye等(2005)整合卫星、气候、生物、大气等相关数据,研究了干旱预测及其与植物生长之间的关联关系;B.Ekasingh等(2005)基于数据挖掘方法进行了农户作物种植选择行为进行了模拟;Mignolet等(2007)基于数据挖掘研究了塞纳河盆地农作活动空间动态关联特征。国内学者也在空间关联知识的算法和应用上取得了丰富的成果,如朱庆伟、苏里等(2006)应用粗糙集提取了土壤侵蚀度与植被、坡度和耕地之间的关联关系,武汉大学的秦昆(2006)将概念格应用于图像数据的关联规则挖掘中。
综上所述,可见国内外在空间关联知识研究方面已取得丰硕的理论和应用成果,获取的知识在解释地理规律方面起到了一定的作用。
(2)地理实体语义相似度的获取与表达(www.xing528.com)
随着GIS专题数据广泛应用于决策、分析、规划、评价和管理,专题数据库综合逐渐成为GIS和地图学领域研究的热点(李红梅,2009)。专题数据库的综合中需要同时兼顾空间邻近度、语义邻近度以及图斑指数等因素,如果把实体类型之间的相似度定量化为语义相似度,那么从某种意义上讲,在模型综合层面就可以通过语义相似度来控制和指引专题数据的转换操作,而在图形综合层面可以实现同时考虑空间邻近、语义邻近和图斑指数三种不同的度量对次要图斑进行合并。可见,将语义相似度引入专题数据库综合中具有重要的理论和现实意义。
近年来,本体在人工智能、软件工程、语义Web、信息检索等领域发挥了越来越重要的作用(李文杰,2010)。本体给出了构成相关领域词汇的基本概念和关系,并且构建了关键词的同义、上下位及平级扩展,已形成了关键词丰富的扩展概念集(聂卉,2007),还可以表示这些概念的属性以及同义、继承、部分整体等概念之间的关系。本体主要关注的焦点在于实体本身,具体到地理信息系统领域就是对地理空间实体目标域的关注(李红梅,2005)。在GIS领域中,本体是用于解决地理概念分类以及地理概念之间的相互关系的,它侧重的是实体的属性和实体之间的关系,而不是对实体的操作。本体引入GIS领域的最大意义在于对空间信息语义理论的丰富,主要反映了地理信息科学研究重心的转移。本体代表了GIS科学研究的新方向,在GIS中本体扮演了一个重要的角色,它允许人们去获取独立于数据表达的语义信息。
因此,基于本体的语义相似度计算是一项非常重要的基础性研究工作,一个好的语义相似度测度方法对于信息检索、信息集成、数据挖掘、知识工程、语义Web等研究工作具有重要的意义。同时,它还是专题数据库综合中语义邻近度计算的基础。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。