2.5.7.1 知识建模
知识建模,即为知识和数据进行抽象建模,主要包括以下5 个步骤:
以节点为主体目标,实现对不同来源的数据进行映射与合并(确定节点);利用属性来表示不同数据源中针对节点的描述,形成对节点的全方位描述(确定节点属性、标签);利用关系来描述各类抽象建模成节点的数据之间的关联关系,从而支持关联分析(图设计);通过节点链接技术,实现围绕节点的多种类型数据的关联存储(节点链接);使用事件机制描述客观世界中动态发展,体现事件与节点间的关联,并利用时序描述事件的发展状况(动态事件描述)。
2.5.7.2 知识抽取
从不同来源、不同结构的数据中进行知识提取,主要进行实体抽取和关系抽取,形成知识存入到知识图谱,这一过程我们称为知识获取。针对不同种类的数据,我们会利用不同的技术进行提取。
从结构化数据库中获取知识采用D2R 技术,难点是复杂表数据的处理。从链接数据中获取知识采用图映射技术,难点是数据对齐。从半结构化(网站)数据中获取知识使用包装器技术,难点是方便的包装器定义方法,包装器自动生成、更新与维护。从文本中获取知识采用信息抽取技术,难点是结果的准确率与覆盖率。(www.xing528.com)
图2-16 知识图谱的构建技术
2.5.7.3 知识合并
合并外部知识库—将外部知识库融合到本地知识库需要处理2 个层面的问题。数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余;通过模式层的融合,将新得到的本体融入已有的本体库中。
合并关系数据库—在知识图谱的构建过程中,一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界将这一数据转换过程形象的称为RDB2RDF,其实质就是将关系数据库的数据转换成RDF 的三元组数据。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。