本体构建及标注负责将关联数据通过语义标注等技术,增加TBox,使关联数据进一步成为本体。
首先,输入关联数据集。判断其是否具有较完备的约束、规则、公理。如果约束、规则、公理完备,则可直接生成本体的T-Box。通过OWL接口程序,自动将关联数据集的RDF数据转为本体。然后由用户进行评分,在一段时间内经过用户使用评分过低的直接消除其本体形式。一段时间后判断本体是否符合要求,如果满足要求,则直接为其创建实例,完成本体构建。如果不满足要求,则由领域专家负责对自动生成的本体进行调整,然后创建实例。
如果输入已存储和索引的关联数据集不具备较完备的约束、规则、公理,则需要通过语义标注等技术为其生成T-Box。
首先自动定义本体的领域(Domain)和应用范围(Range),同时定义范围,根据具体要求自动建设本体。
自动查找可重用的现存本体。通过查询LOD,查找对应的本体。
根据用户输入的知识点条目列表及本体库中对应本体,自动列举本体中的术语(Terms)。这些术语作为新建本体中的备用词汇,以描述类、属性、实例等。
自动定义类及类的结构。采用类结构自动划分法,从LOD中最接近的数据集所提供的对应本体获取顶层通用类,然后逐步细化,直至问题描述清楚为止。
自动定义槽。即定义类的内部和外部属性。(www.xing528.com)
自动定义槽的面。槽的面用来描述值的类型(Type)、值的范围(Allowed Values)和值的基数(Cardinality)。基数是槽所能允许的值的个数。类型通常有字符串(String)、数值(Number)、枚举(Enumerated)、布尔(Boolean)、实例(Instance)等。值的范围也需要和类相对应,以能够从各个方面来描述类。
完成类及定义、槽定义、面定义后,T-Box基本生成。此时可自动生成候选本体。然后由用户进行评分,保留多位用户评分较高的候选本体。
然后判断保留的候选本体是否满足一致性检测等要求,如果满足,则自动创建实例。如果不满足,则经领域专家调整后,创建实例。
自动创建实例(Instance)。创建个体实例是创建知识库的最后一步,选择恰当的类,给类创建个体,给槽赋值。
本体构建完成后,根据不同类型文件的需要,通过自动本体标注算法,进行自动本体标注。倘若文件类型是OWL或RDF,则直接将相关项对应于已有本体,实现自动本体标注。如果文件类型是资源文档,则分别调用概念识别、类识别算法,进行关系识别运算,完成自动本体标注。
图4-7 自动本体构建方法
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。