针对标签的自由所带来的标签的无控制性、平面性及分散性等不足,研究者提出了多种后控手段。标签本体(tag ontology)是标签和本体技术的结合,是描述标签语义的一种工具,是一种本体对标签进行控制的方法。也就是说,标签本体利用本体的语义控制功能在语义层次上组织和构建标签语义网络,对用户的标记行为(赋标签的行为)进行标识和控制,以实现对“标签泛滥的限制、垃圾标签的过滤和歧义标签的规范”。[1]
自2005年Gruber提出标签本体的概念以来,许多研究者都投身其研究之中。标签本体的发展也从关注标注活动发展到关注folksonomy(协同标注活动),从考虑标注活动要素发展到考虑标注目的、标签共现频率、标签词形变异等协同标注方面。此外,还有研究者从标签含义的角度,创建了MOAT,跨越了标注行为与语义检索的鸿沟。Kim等学者提出整合多个标签本体,更是标志着标签本体的发展进入了统一、共享的新阶段,一个完整、通用的标签本体即将出现。这给发挥folksonomies最大效能、支持语义检索做出了重大贡献,也给进一步推动语义网的发展做出了贡献。[2]
标签本体借用了本体的形式。同本体一样,标签本体也具有概念模型、明确、形式化、共享等含义。标签本体通过建立起标注者、资源和标签之间的关系模型,同时关联资源出处和标记日期等信息来规范、控制标签,达到共享标签的目的。因而,标签本体的标注实际上是借用了本体的理念来规范描述标签和控制标签的应用。
虽然标签规范化处理能够表达一定的语义关系,但由于标签是由网络用户自由标注产生的,所以由此构建的“本体”与由领域专家构建的本体之间还存在着差异。在社会化标注系统环境下形成的标签集合,虽然不是严格的概念,但其本身也存在同义、近义、种属、反义的语义关联,并有部分标签与本体概念重合。这使得标签与部分本体概念间的映射是可行的,通过映射可以找到两者之间的语义关系,从而自动生成标签本体。[3]
标签本体的简单标注结构是“二元组结构”,标签本体的核心概念是标注tagging。标注是指用户使用一个或一组标签对其创造或浏览的信息内容进行描述的过程,因此构建标签本体时,首先需要揭示这个二元组关系,即tagging(object,tag)。
基本元素必须包括标引者(tagger)、标签(tag)以及资源(resource),也就是所谓的标签处理三元组:tagging(U,T,R)。(www.xing528.com)
标签处理多元组基本表示为:tagging(object,tag,tagger,source,date)或folksonomy(tag set标签集,user group用户组,source来源,tagging标签标注,occurences频次)。
本体的构建方法比较成熟的有骨架法、TOVE法、KACTUS工程法、METHONTOLOGY法和基于SENSUS的本体构建法等。在标签本体构建时,研究者应根据标签的特点,借鉴本体构建的已有的成熟方法。[4]
SCOT即Social Semantic Cloud of Tags,可理解为标签的社会性语义云图,是标签本体模型的典型应用。其目标是在语义层次上为标签提供一个机器可理解的框架,在语义网络中为标注活动所描述的信息对象的概念和属性(如用户、标签、资源等)提供表示模型,为标签数据的共享和重用提供便利。
SCOT主要的特点是能够描述标注活动,并展示在线虚拟社区中的各个元素之间的关系,即描述被标记的信息对象的结构和语义,并提供一种社会互操作性——为了共享和重用标签数据,以及描述来自不同资源的用户之间的关系。
为了达到这一目标,SCOT采用现有的计算机可理解的语言如RDF/OWL来定义词汇,以便计算机更好地对其进行处理。SCOT词表的核心要素是标签云,SCOT不仅能够识别标签云本身,还能反映标签与其他元素和属性之间的联系。[5]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。