知识图谱是一种融合多学科的研究方法,借助数学、图形学、信息可视化技术等学科的理论和方法,知识图谱结合计量学中的分析工具与社会网络分析法,将学科领域的核心结构、发展历史、前沿领域以及知识框架用可视化的图谱形象地展示出来。
与知识图谱紧密相关的要素包括两个部分:信息可视化技术与知识管理。信息可视化技术是构成知识图谱的基础和关键技术。所谓信息可视化技术,是指利用计算机技术将抽象的数据利用交互的模式展现出来,以增强人们对那些抽象信息的认识,将非空间的信息空间化,使其更符合人们的视觉习惯,从而在此基础上实现对作者、引文、期刊、关键词、学科内容,以及信息检索过程的可视化表达,最终达到信息检索结果的可视化。
信息可视化是建立在数据可视化基础上的,而知识可视化又是以信息可视化为基础的。这三者相互区别又相互联系。首先,信息可视化是以抽象的信息为主要对象,任务在于搜索和发现信息之间的关系和信息中隐藏的模式;其核心问题是寻找表示信息的可视化结构,并理解其支持的分析任务;信息可视化能够将复杂抽象的语义关系以直观的图形方式呈现给用户。知识图谱与信息检索过程可视化、信息检索结果可视化均属于信息可视化。其次,知识可视化是借助数据挖掘和知识发现等方法所获得的知识和规律,尤其是知识的构成和知识之间的逻辑关系,并运用可视化的方法表现出来,使得知识容易理解。
知识管理是知识图谱方法的目标,它是通过一定的科学技术和管理理论与方法,实现知识价值的最大化。知识管理的概念分为广义和狭义,狭义的知识管理是指对知识本身的管理;广义的知识管理是除了对知识本身的管理,还包括对与知识有关的各种资料和知识产权的管理。因此,知识图谱方法实际上就是这样一种有效的形式:它能够在知识管理中挖掘数据和发现知识,发现数据之间隐含的联系和价值及其之间的规则,由此探索知识的价值内涵。在这些方面,知识图谱具有其他方法无可比拟的优越性和独到之处。
相对于传统的知识表述、管理、储存等表现方法,知识图谱的优越性是显而易见的,具体而言,知识图谱的原理和方法主要包括引文分析、共被引分析、多元统计分析、共词分析、社会网络分析等一些方面。
第一,引文分析就是利用统计学的方法和归纳、概括等逻辑方法,对期刊论文、硕博士论文、著作等分析对象的引用和被引用的情况进行分析,揭示其数量特征和内在规律的一种文献计量分析法。在这一方法中,引文率是最基本的测度。该理论可以用来测定学科的影响和重要性,评价学术期刊等。
第二,共被引分析是研究学科演进与变化的理论,认为当两篇文献同时被第三篇文献引用时,就称为这两篇作品存在共被引关系;文献共被引的次数越多,它们之间的关系就越密切,相关性也就越高。通过这样的分析,就可以将学科之间的共被引的网状关系简化为数目较清晰的若干群类之间的关系并直观地表示出来。共被引分析又可以分为文献共被引分析、期刊共被引分析、作者共被引分析、学科共被引分析等。共被引分析是一种重要的信息计量方法,旨在统计两两分析对象之间的被引用的强度,分析对象之间复杂的关系以及学科的结构特点和发展趋势。
第三,多元统计分析关注的是若干相关随机变量的分析,运用维度降低技术,亦即将高维度空间的目标投影到低维空间,一般是指二维空间。其中包括因子分析、多维尺度分析和聚类分析。
第四,共词分析法也被形象地称为词共现分析法,是对文献内容特征进行分析的方法,通过对一组词在同一篇文献中出现的频率的统计,进行聚类分析,反映词与词之间的疏密关系,进而发现学科的热点以及领域内的动态发展和静态的结构。(www.xing528.com)
第五,社会网络分析法是一种跨学科的交叉科学分析方法,强调行动者之间的关系是研究的第一要素,旨在将复杂的学术网络通过分析可视化。
上述这些理论和方法是知识图谱得以实现的理论基础和指导。由于信息可视化技术的迅猛发展,为绘制知识图谱提供了坚实的技术支撑,具体表现为知识图谱绘制工具软件相继诞生及其技术手段的日趋成熟。目前可选择的知识图谱制作工具,约有20多种,如引文分析软件(Bibexcel、CiteSpace)、词频分析软件(HistCite、WordStat)、多元统计分析软件(SPSS)、社会网络软件(Pajek与Ucinet,Netminer)、地理信息系统(GIS)软件包括谷歌地图(Google Maps)、雅虎地图(Yahoo Maps)等。
引文分析软件包括由瑞典科学家佩尔松(Olle Presson)开发的专门文献计量软件Bibexcel,用于帮助用户分析文献数据或者文本类型格式的数据,有着强大的分析功能,包括引文、共引、聚类分析、科学知识图谱的绘制等。不过,该工具的可视化功能较弱,主要被用于前期的数据预处理过程中。而由美国陈超美博士开发的可视化知识分析工具CiteSpace,可以读取几乎所有常见格式的文献数据,通过该软件,用户可以可视化地发现文献中随时间变化的特征与变化趋势。该系统还能够利用可视化显示技术在知识域中帮助用户进行突发趋势分析。另如由James A.Wise等人提出的Themespace,是一种解决大型文档集合之间关系的重要工具,对不同的主题以三维立体的形式和不同的高度进行显示,该方法避免了语言处理并减少用户的脑力工作,对于检索信息和挖掘知识比较有用。
词频分析软件包括HistCite、WordStat等。HistCite是由加菲尔德(E.Garfield)博士等人开发的一种引文历史可视化分析工具,能够用图示的方式展示某一领域不同文献之间的关系,帮助研究者快速绘制出一个领域的发展历史,定位该领域最重要和最新的文献。WordStat则可以使用基于方法的词典进行文本的统计内容分析和文本挖掘,是非常先进的专门用于分析文本信息和处理大量的非结构化信息的内容分析工具。
多元统计分析软件如SPSS(Statistical Product and Service Solutions)等,即统计产品和服务解决方案。该软件具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。其突出特点在于操作界面极为友好,输出结果美观漂亮。
社会网络软件包括Pajek、Ucinet和Etminer。Pajek软件是专门为处理大型数据集而设计。它不同于一般的社会网络分析软件,不仅具有强大的数据分析功能,还具有较强的绘图功能,绘图窗口给用户很多选项来处理图表,使其拥有强大的图像处理系统。Ucinet则是目前较为流行的社会网络分析集成软件,其中包含三维分析软件。
地理信息系统(GIS)软件包括ArcGIS、Geomedia(Open GIS)、MapInfo、MapGIS GeoStar、Supermap、Google Maps、Yahoo Maps。其中谷歌地图(Google Maps)是谷歌公司向全球提供电子地图服务的在线平台,使用者可以此搜索目标物,也可以建立自己的地图,与其他分享者分享相关的地理信息等。
综上可见,在信息技术高速发展的今天,知识图谱绘制技术为非遗传承和保护提供了崭新而强有力的工具,而运用这种信息技术制作出来的非遗图谱,则更可以为当今社会非遗资源的保护传承提供强有力的技术支持。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。