首页 理论教育 概念距离法在普适地理信息服务匹配中的应用

概念距离法在普适地理信息服务匹配中的应用

时间:2023-09-25 理论教育 版权反馈
【摘要】:概念Cycle分别与概念Wheeled Vehicle、概念Bicycle相邻,与它们之间的距离均为1。出现这一问题的根源在于将任何两个概念之间的关系边视为同等权重。因此后来的研究主要集中在概念层次结构图中不同位置的关系“边”对于语义距离度量影响权重的建立方法。

概念距离法在普适地理信息服务匹配中的应用

概念距离法基于图论的思想,它把领域内的概念及相互间的关系所构成的概念体系视为一种网络关系图,更为简便直观。当这些概念抽象成为图的时候,概念之间的语义关系问题就相应转化为图的计算问题。例如同一概念体系中的两个概念c1和c2,c1到c2之间的语义距离可以通过连接它们之间的路径表示,当两者无直接路径时,可以通过中间概念c3、c4等。最为简单的一种情况,如果概念网络中概念间的关系是同等性质且具备同样权重的话,那么两个概念间语义相似性问题就转化为图中节点间最短路径分析问题(Rada,2000),语义路径的“长度”即是概念之间的语义距离,语义距离越近,概念之间的语义相似程度越大,这种最短路径也被称为“最短语义路径”。

仍然以图6-10为例,以每条代表关系边的语义路径值为1,则从概念Car到概念Cycle的语义路径分别经过Motor Vehicle、Vehicle、Wheeled Vehicle,语义距离为4。概念Cycle分别与概念Wheeled Vehicle、概念Bicycle相邻,与它们之间的距离均为1。这里就出现一个有违常识的问题,通常认为Cycle与Bicycle相对Wheeled Vehicle的语义相似程度更高,相应语义距离更短。出现这一问题的根源在于将任何两个概念之间的关系边视为同等权重。

因此后来的研究主要集中在概念层次结构图中不同位置的关系“边”对于语义距离度量影响权重的建立方法。Wu-Palmer等(2002)通过概念c1和c2共有的最低层次的父节点概念c0,来度量它们之间的语义相似程度。可用数学公式表示为:

其中,r表示root,即概念层次结构树中的根概念节点。len(r,c3)表示根概念节点和概念c3之间的最短路径。

白东伟等(2003)将这类方法归类为:

式中,l为概念c1和c2之间的最短路径距离;h为c1和c2的最具体共同概念(Most Specific Common Abstraction-MSCA)在层次结构树中的层次深度。例如图6-10中,Car和Bicycle的最具体共同概念(MSCA)就是Vehicle。d为概念层次树中c1和c2所处位置的概念密集程度。(www.xing528.com)

李宏伟等(2004)变换思路,把语义路径问题看作是GIS空间分析中赋权有向图的最短路径问题,即在赋权图G=(V,E)中指定的一对顶点vi,vj间众多的路径中,寻找一条权重和最小的路径。并引入了Dijkstra算法,它是一种标号法,通过每一个顶点记数标号递归计算最终的最短语义路径。

概念距离法特点:

(1)概念距离法主要顾及了概念层次结构树的结构特征,不需要额外的概念概率计算:

①最短路径距离。概念之间最短路径距离越短,语义相似性越强。

②概念所处的层次。越接近底层,概念的具体程度越高,相互之间的语义距离越近。

③子树节点的密集程度。节点越密集,相互间的语义相似性越强。

(2)在语义计算过程中将概念层次既考虑最短路径距离,又顾及概念层次和概念密集度,虽然增强了语义分辨能力,但会大大增加本体建模规模。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈