3.2.2.1 认识知识计算
知识计算是从大数据中首先获得有价值的知识,并对其进行进一步深入的计算和分析的过程。也就是要对数据进行高端的分析,需要从大数据中先抽取出有价值的知识,并把它构建成可支持查询、分析与计算的知识库。知识计算是目前国内外工业界开发和学术界研究的一个热点。知识计算的基础是构建知识库,知识库中的知识是显式的知识。通过利用显式的知识,人们可以进一步计算出隐式知识。知识计算包括属性计算、关系计算、实例计算等。
3.2.2.2 知识计算的应用
目前,世界各个组织建立的知识库多达50余种,相关的应用系统更是达到了上百种。如维基百科等在线百科知识构建的知识库DBpedia,YAG,Omega,WikiTaxonomy;Wolfram的知识计算平台WolframAlpha;Google创建了至今世界最大的知识库,名为Knowledge Vault,它通过算法自动搜集网上信息,通过机器学习把数据变成可用知识,目前,Knowledge Vault已经收集了16亿件事实。知识库除了改善人机交互之外,也会推动现实增强技术的发展,Knowledge Vault可以驱动一个现实增强系统,让我们从头戴显示屏上了解现实世界中的地标、建筑、商业网点等信息。
知识图谱泛指各种大型知识库,是把所有不同种类的信息连接在一起而得到的一个关系网络。这个概念最早由Google提出,提供了从关系的角度去分析问题的能力,知识图谱就是机器大脑中的知识库。
在国内,中文知识图谱的构建与知识计算也有大量的研究和开发应用,如图3-13是心房颤动知识图谱;如图3-14是心肌炎知识图谱;如图3-15是中药人参知识图谱。具有代表性的有中国科学院计算技术研究所的OpenKN,中国科学院数学研究院提出的知件(Knowware),上海交通大学最早构建的中文知识图谱平台zhishi.me,百度推出了中文知识图谱搜索,搜狗推出的知立方平台,复旦大学GDM实验室推出的中文知识图谱展示平台等。这些知识库必将使知识计算发挥更大的作用。
图3-13 心房颤动知识图谱(www.xing528.com)
图3-14 心肌炎知识图谱
图3-15 中药人参知识图谱
通过知识图谱建立事物之间的关联,扩展用户搜索结果,可以发现更多内容。例如,利用百度的知识图谱搜索“达·芬奇”,会得到其生平介绍和他的画作等相关内容,如图3-16所示。
图3-16 通过知识图谱搜索到的达·芬奇画作
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。