知识图谱是信息技术领域的一种基于图的数据结构,用来描述客观世界中的概念、实体(Entity)和关系(Relation)。知识图谱的数据结构由节点(Point)和边(Edge)组成,每个节点表示语义符号,即概念和实体,每条边表示语义符号之间的语义关系。通俗来讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从关系的角度去分析问题的能力。
知识图谱可以被看作一种图结构的数据库,所有需要用到数据库的场景都可以做成图谱。任何特定行业都可以建立自己的知识图谱,方便知识管理和知识搜索,只是工程量大、费时费力,需要长期维护。
知识图谱是一种知识管理工具,和本体(Ontology)联系密切。在表现形式上,知识图谱和语义网络(Semantic Network)相似。语义网络由相互连接的节点和边组成,节点表示概念(Concept)或者对象(Object),边表示它们之间的关系。不过,语义网络更侧重于描述概念或对象之间的关系,而知识图谱则更偏重于描述实体之间的关联。
知识图谱是由谷歌在2010年收购了开放式数据库公司MetaWeb后发展而来的。MetaWeb当时专注于将不同文字表述与同一实体连接起来,并探索这些实体的属性(如明星的年龄)以及彼此之间的联系,最终提供一种新的搜索形式。有了知识图谱,谷歌可以更好地理解用户搜索的信息并总结出与搜索相关的内容,帮用户找出更准确的信息。用户利用知识图谱往往会获得意想不到的发现。例如,用户可能会了解到某个新的事实或新的联系,从而促使其进行一系列全新的信息检索。
通过知识图谱可以完成两个重要的目标:
1.通过知识分类提高搜索精度。
2.通过知识分类优化搜索结果的展示。
知识图谱的关键技术有:(www.xing528.com)
1.实体的抽取,是指从无结构或半结构的Web文档中提取结构化的信息,并将其关联到某个实体概念上。
2.知识图谱中实体和实体之间关系的建立。
案例 谷歌知识图谱是谷歌的一个知识库,其使用语义检索从多种来源收集信息,以提高谷歌搜索的质量。谷歌于2012年将知识图谱加入其搜索服务,首先在美国使用。据谷歌称,知识图谱的信息有许多来源,包括美国中央情报局(CIA)的《世界概况》、Freebase和维基百科。其功能与Ask.com和WolframAlpha等问题问答系统相似。截至2012年,谷歌知识图谱的语义网络包含的对象超过570亿个,介绍超过18亿个,这些不同的对象之间有链接关系,用来理解搜索关键词的含义。知识图谱应用示例如图2.7所示。
案例 金融行业业务本体(the Financial Industry Business Ontology,FIBO)是一个商业概念模型库,描述了金融行业中的金融工具、商业实体和工作流程,将金融知识标准化和模型化,可用于数据协调、标准化数据集成和机器学习。
案例 腾讯知识图谱项目Topbase是腾讯技术工程平台部(TEG-AI)构建和维护的一个通用知识领域图谱项目。Topbase涉及226种概念和1亿多个实体。在技术上,Topbase支持知识图谱的自动构建和数据的及时更新。目前,Topbase主要应用于微信的“搜一搜”、信息流推荐和智能问答等产品中。12
图2.7 知识图谱应用示例
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。