首页 理论教育 语义相似度在地理空间实体中的应用

语义相似度在地理空间实体中的应用

时间:2023-05-18 理论教育 版权反馈
【摘要】:需要说明的是,语义相似度的研究工作是在GIS专题数据综合领域背景下进行的。地理空间实体语义相似度是指地理空间实体之间语义的邻近程度或接近程度。

语义相似度在地理空间实体中的应用

语义相似度在不同的领域中可能会有不同的含义(徐德智,2006)。例如,在信息检索中,语义相似度是概念之间词语的可替换度以及词义的符合程度,它更多地反映文本与用户查询在意义上的符合程度;而在信息整合领域中,语义相似度则是指文本与文本能够统一的程度。相似度越高,则文本与用户的请求越接近。需要说明的是,语义相似度的研究工作是在GIS专题数据综合领域背景下进行的。

地理空间实体语义相似度是指地理空间实体之间语义的邻近程度或接近程度。相似度是一个数值,其取值范围为[0,1]。当被比较的两个实体的相似度值为1时,表明这两个实体的语义完全相同;当被比较的两个实体的相似度值为0时,表明两个实体的语义完全不同。在其他情况下,实体间的相似度值在[0,1]之间取值,且相似度值越接近1,则表明两个实体越相似。

本体论应用于计算机领域的过程中,研究者提出了多种语义相似度算法。总的来看,基于本体的概念间的语义相似度测度模型可以归为三大类:①基于语义距离的测度模型,即以概念之间路径的长短作为衡量语义距离的标准;②基于信息内容的测度模型,即利用两个概念共享的信息量多少来衡量它们之间的语义距离;③基于属性的测度模型,即通过比较两个概念对应的属性来衡量概念之间的语义相似度。

1.基于语义距离的测度模型

基于语义距离的测度模型(distance-based calculation model)的基本思想是通过概念节点在本体层次结构中的语义距离来反映概念间的相似度(刘群等,2002),路径距离越短,它们之间就越相似。假设本体中各关系边的权重都为1时,则两个概念S和F的语义距离,就等同于在本体层次结构里构成S、F的节点之间最短路径所包含的关系边数量。其计算公式为:

式中,δ为可调节因子;Dist(S,F)为两概念节点S、F的通路中的最短路径长度。当Dist(S,F)=0时,语义相似度为1,说明两概念为同一概念。

2.基于信息内容的测度模型

基于信息内容的测度模型(information content based calculation model)的基本思想是以两个概念间的共享信息程度作为度量语义相似度的依据。如果两个概念共享的信息越多,则它们之间的语义相似度就越大;反之,如果两个概念共享的信息越少,则它们之间的语义相似度就越小。在本体结构中,每一个概念都可以认为是对它祖先节点的细化(刘紫玉等,2011),因此可以近似地理解为每一个子节点包含它所有祖先节点的信息内容。这样,两个概念的语义相似度就可以用其最近共同祖先节点的信息量来衡量。本体层次结构中,信息量的计算公式为:

式中:IC(S)表示概念S在领域本体中所蕴含的信息量;N(S)为概念S在训练样本中出现的次数;N为训练样本总数。由式(3-2),可得到领域本体概念层次结构中,任意一对概念S与F的语义相似度计算公式为:(www.xing528.com)

式中:Parent(S,F)是概念S和F在领域本体层次结构中最近的共同祖先节点。

3.基于属性的测度模型

基于属性的测度模型(attribute-based calculation model)的基本思想是通过比较两个概念对应属性来衡量概念之间的语义相似度。基于属性的语义相似度计算公式为:

式中:Attr(S)∩Attr(F)表示概念S属性集合与概念F属性集合的并集;Attr(S)-Attr(F)表示概念S具备但概念F不具备的属性集;Attr(F)-Attr(S)表示概念F具备而概念S不具备的属性集。

4.GIS领域的现有研究模型

近年来,尽管语义相似度在计算机领域和认知语义学领域进行了大量的研究,建立了多种评价模型,但这些模型的实质都是基于以上三种模型的。在GIS领域,语义相似度的研究也有部分学者涉及,如美国布法拉大学的C.C.Feng、D.M.Flewelling以及武汉大学的李红梅等,并且他们研究的评价模型大多基于本体的土地利用分类和覆盖方面,这就为专题数据库综合方面的研究奠定了一定的基础。

但是总的来看,这些研究的模型考虑的因素过于单一。例如,有些研究仅仅考虑了实体属性方面的因素,而忽略了语义距离等方面的影响因子,这样就可能使语义相似度的计算结果与人类的主观认知不太符合,从而达不到最终的研究目的。因此,在现有地理空间实体语义相似度模型研究的基础上,进一步讨论语义相似度的影响因子——概念的属性、语义距离(概念间的关系、深度、密度等),最后提出基于本体的地理空间实体语义相似度测度模型,从而更加全面地量化本体结构中实体之间的语义相似度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈