知识图谱(Knowledge Graph)是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法同计量学引文分析、共现分析等方法相结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制以显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考[3]。
2012年5月17日,Google正式提出了知识图谱(Knowledge Graph)的概念,其初衷是为了优化搜索引擎返回的结果,提升用户搜索质量及体验[4]。实际上,知识图谱并不是一个全新的概念,早在2006年就有文献提出了语义网(Semantic Network)的概念,呼吁推广、完善使用本体模型来形式化表达数据中的隐含语义,RDF(Resource Description Framework,资源描述框架)模式和 WOL(Web Ontology Language,万维网本体语言)就是基于上述目的产生的。用电子科技大学徐增林教授在论文中的表述来说,知识图谱技术的出现正是基于以上相关研究,是对语义网标准与技术的一次扬弃与升华。目前,随着智能信息服务应用的不断发展,知识图谱已广泛应用于智能搜索、智能问答、个性化推荐等领域。
在图情领域,知识图谱被定义为显示科学知识发展进程与结构关系的知识网络,通过知识域可视化,帮助“知识发现”的领域知识映射出地图;运用一系列各种不同的可视化图形描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;将既定主题下的抽象科学信息映射入空间结构和图形,形成网状化可视化方法。知识图谱能够实现知识的创造与传递,特别是对于领域知识网络,能反映出一个领域内部知识的流动与传播,挖掘出在显性信息中难以发现的潜在知识,充分发挥出人文资源的价值和作用。
Quora上有一种经典的解读,区分“信息”和“知识”,见图11-1。(www.xing528.com)
图11-1 信息与知识关系
在信息的基础上,建立实体之间的联系,就能形成“知识”。知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Object)。在知识图谱中,我们用RDF形式化地表示这种三元关系。RDF是W3C制定的一种用于描述实体/资源的标准数据模型。RDF中有3种类型:IRI、blank node 和 literals,常用的是IRI和literals。IRI(International Resource Identifier)可以看作是URI或URL的泛化,用于在整个知识图谱中唯一地表示一个实体/资源。literals即字面量,可以看作是带有数据类型的纯文本。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。