首页 理论教育 主题地图结构:基于学术单元的多维度标签构建研究

主题地图结构:基于学术单元的多维度标签构建研究

时间:2023-07-31 理论教育 版权反馈
【摘要】:主题地图的基本结构是在独立于信息资源之外建立了一个信息资源索引,构建了一个结构化的语义网。[31]主题地图的两个层次即上述结构中所说的位于下层的资源域和位于上层的主题域。[32]主题地图的关联是描述两个或多个主题间相互关系的联结元素。主题、关联和事件构成了主题地图的基本架构,而范围则限制了这些主题、关联和事件的有效范畴。机器自动创建主题地图要视信息源的结构而定。

主题地图结构:基于学术单元的多维度标签构建研究

主题地图的主要内容可以概括为:一个模型、两个层次、三个概念。主题地图的基本结构是在独立于信息资源之外建立了一个信息资源索引,构建了一个结构化的语义网。[30]资源域(信息资源的集合,位于下层)和主题域(即知识地图,位于上层)通过事件联结(即将特定的主题指向具体的信息资源),就构成了主题地图。[31]

主题地图的两个层次即上述结构中所说的位于下层的资源域和位于上层的主题域。

主题地图的三个主要概念是主题(topic)、联系(association)、事件(occurrence),合称为“TAO”。

在主题地图中,知识的基本单元称为“主题”——topic。Topic这个词的来源是希腊词topos,代表位置(location)和主题(subject)。就其最普遍的意义而言,主题可以是任何东西——人、实体、概念或者其他东西——而不管它是否存在或者是否有具体的特征,凡是能引起使用者讨论的对象都可以是一个主题。主题可以划分为群,称为主题类型(topic types)。换言之,主题类型就是主题所归属的类别,一个主题可以归属到一个以上的主题类型,主题类型在主题地图中也被认定为一个主题。[32]

主题地图的关联是描述两个或多个主题间相互关系的联结元素。关联的形式可以是一对一、一对多或多对多,形成的关系也可以多种多样。比如金庸与他写的15部小说,其关系是“撰写”,其形式是一(金庸)对多(15部小说)。主题间的关联也具有不同的类型,对关联类型的区分,有助于增强主题地图的表达能力

一个主题可以联结至一个或多个在某种层面上被视为与该主题相关的信息资源,这样的信息资源称为该主题的事件。资源可以是一篇文章,也可以是一段视频,还可以是一张图片。这些事件一般都是独立于主题地图之外的,而主题地图一般借助HyTime addressing或XPointer等系统支持的机制对事件进行定位。但在实际运用的过程中,事件通常是指储存在全球信息网里的任何形式的资源,意即可以经由统一资源定位符(URL)存取到资源。[33](www.xing528.com)

除了主要概念之外,主题地图还有公共主题(identity,也称主题身份识别)、分面(facet)和范围(scope)三个概念,合称“IFS”。

主题地图的目的是定义主题和它所表示的话题之间的一一对应的关系,以保证关于某一个特定话题的所有知识都可以通过一个单独的主题来访问。但是,有时候一个相同的话题可能由不止一个主题来表示,尤其是在对两个主题地图进行合并的时候。在这种情况下,就有必要用某种方法在看起来明显不同的主题之间建立等同关系。

分面是基于信息资源自身属性的一种过滤,而范围是基于主题属性的一种过滤。分面的作用是从主题地图内部为构成主题事件的信息资源分配元数据。这类元数据本来应该是由SGML和XML的属性或者是文献管理系统提供的,但在主题地图中,这类元数据由分面来指定。

范围是一个特殊的主题,它定义了一组在一定界限内的相关主题,以描述上下文环境的概念。范围通常用主旨来定义,而一个主旨实际上就是一个主题,并限定一系列分配的有效性。事实上,主题地图中范围的作用不仅仅在于消除不确定性,它也可以辅助导航,比如从使用者一方的角度来动态地改变其对主题地图的视角和主题地图的使用方式。主题、关联和事件构成了主题地图的基本架构,而范围则限制了这些主题、关联和事件的有效范畴[34]

主题地图的创建方式有人工方法和机器自动创建两种。人工方法创建的主题地图内容丰富,质量较高,但耗费的人力非常大。机器自动创建主题地图要视信息源的结构而定。一般而言,如信息源结构化较强,自动创建的主题地图效果就较好;如果结构化不强,则需要多种自然语言处理工具的辅助。自动创建主题地图通常需要一个文本编辑器,也可以借助一些专门的主题地图编辑软件和主题地图自动生成软件。[35]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈