(一)知识图谱的概念及应用
科学知识图谱,是显示科学知识的发展进程与结构关系的一种图形,它是以科学知识为计量研究对象的,属于科学计量学(Scientometrics)的范畴,是用定量统计方法发现科学知识指数增长规律的科学。计量学奠基人普赖斯是科学知识图谱的早期开拓者。随着科学计量学的发展,描绘科学知识和科学活动规律的数学模型,逐渐从二维空间模型发展为开始运用三维空间模型,科学知识图谱也相应地从简单的曲线图发展为较复杂的三维立体图。科学知识图谱定义为视觉化地描述人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系,在组织内创造知识共用的环境以促进科学技术研究的合作和深入。其描述的对象主要包括:从事科学技术活动和作为知识载体的人,显性或编码化的知识,以及过程或方法[46]。
在中国最先命名和引入科学知识图谱的是来自大连理工大学——德雷塞尔大学(美国)知识视觉化与科学发现联合研究所的学者陈悦和刘则渊,他们在《科学学研究》上发表文章介绍了科学知识图谱的发展历程,也开启了科学知识图谱在国内的传播和研究。但需要说明的是,“知识图谱”是国内学者刘则渊和陈悦对这一产生于国外的理论的命名,国外相关领域研究并没有采用统一的“知识图谱”概念,所以在评述这个概念时,本研究主要以国内学者的文献为主,而国外相关领域的研究评述将具体放在后面“科学知识图谱理论与方法的发展”这个部分中讨论。
国内其他学者在描述知识图谱的定义时大同小异,如表2-3所示,同在都认为知识图谱可以揭示科学知识发展进程与结构关系的方法;异在强调定义内容侧重点时,在外部特征、学科基础(应用数学、电脑科学、科学学、资讯科学、统计学、图形学等)、绘制方法(引文分析、共现分析、社会网络分析等)等上有所不同。知识图谱研究人员多认为它属于科学计量学的学科范畴,但由于在研究对象、方法及理论基础等方面的一致性,科学计量学与文献计量学、资讯计量学等领域也有对知识图谱的研究[47]。
表2-3 知识图谱的定义比较表
续表
(www.xing528.com)
目前,国内外许多科学领域的研究者们开始运用科学知识图谱,其原因在于人类感知外部信息体验中发挥主导作用的是视觉体验和认知,而科学知识图谱具备视觉化这个最突出的特点。图形图像是形成视觉体验的首要因素,而科学知识图谱的最大特点即是用直观、图形化的方式呈现科学知识、数据和信息,其作用比文本信息要直观生动,符合人类的认知习惯,图片的直观性和易理解性会胜过数千字的描述[48]。陈悦和刘则渊认为科学知识图谱在学科研究中主要可以实现八大功能:揭示科学中潜在的学科结构、追踪科学研究的前沿问题、探测某一时期科学研究热点、剖析科学发展演化历程、研究并分析科研合作网络、评估某科学家的学术地位、构建科学发现的理论体系、辅助决策者制定科学发展方案[49]。这是因为科学研究中引文与被引文之间存在着研究内容上的必然关联。研究学科作者群体和学科间的渗透关系、分析学科与学科之间的衍生关系及拓扑结构,都可以运用引文聚类分析方法,特别是引文间的共被引知识图谱作为研究的理论依据。在此基础上,通过对学科起源背景、发展全貌以及取得的突破性进展进行研究和总结,揭示学科的动态渗透结构和未来的发展走向[50]。也因为科学计量学与文献计量学之间的密切联系,知识图谱已经成为目前文献计量共被引分析研究的主要表现形式。国外研究人员White,McCain,Garfield,Huang等对知识图谱的用途扩充到:文献、专利的结构分析;学科动态、社会网络、领域发展分析等。Shiffrin等认为,涉及展开的学科间科学区域的知识图谱旨在绘制图形、挖掘、分析、分类、导航以及显现知识等[51]。国内学者杨思洛与韩瑞珍曾对1981年至2012年科学知识图谱的研究和应用领域做过统计分析,发现科学知识图谱的研究广泛分布在国内外的管理学、经济学、情报学、教育学等学科[52]。
(二)科学知识图谱理论发展概述
科学计量学的开创者是20世纪50年代的普赖斯,他论证了贝尔纳分析科学的三大特征:定量研究、理论模式、政策与管理研究,将科学计量学纳入科学学研究领域,此后视觉化研究成为科学计量学领域中的研究热点,在此基础上产生了以引文分析方法和信息可视化方法为根基的科学知识图谱研究[53]。
历史同一时期,加菲尔德这位美国科学情报研究所(ISI)的创始人在《科学》上发表了关于引文搜索的文献Citation indexes for science:A new dimension in documentation through association of ideas[54],这篇文章被视为引文分析方法的奠基之作。加菲尔德之后于1963年编写的《科学引文索引》(Science Cited Index,SCI),实现了科学计量学从历史分析到引文分析的转变。怀特和麦肯恩认为《科学引文索引》(SCI)是科学资讯检索领域具有极大影响的里程碑式突破[55]。此后,普赖斯在《科学文献的网络》文中首次阐释了“研究前沿”的含义[56];加菲尔德在The Use of Citation Data in Writing the History of Science中绘制了遗传物质DNA研究的发展演进图谱。
20世纪70年代间,科学计量学家亨利·斯莫尔依据SCI资料库绘制了粒子物理学科的高被引论文的共引网络图谱,由此丰富了引文分析的方法,亨利·斯莫尔在其研究中首次提出了“共引”的概念,介绍了共引的分析方法,还界定了“共引强度”的定义用来测量论文的共引程度[57]。
在以上计量学家及其理论的贡献之后,资讯视觉化发展成为科学知识图谱发展的新阶段。1987年,美国国家科学基金会(National Science Foundation,NSF)公布的研究报告Visualization in scientific computing:Report of the NSF Advisory Panel on Graphics(科学计算中的视觉化)称科学视觉化将成为美国国家科学基金会资助的新研究领域,该报告可视为科学视觉化研究领域正式产生的标志。斯图尔特·卡德和约克·麦金利以及乔治·罗伯逊于1989年首次提出了“资讯视觉化”(Information Visualization),并解释这种理论、技术与方法的最大特点是用互动式视觉表现非空间的、非数值的和高维资讯[58]。
1999年后,美国德雷塞尔大学(Drexel University)陈超美教授成为资讯视觉化技术领域代表人物之一,他先后出版《资讯视觉化与虚拟环境》、《科学前沿图谱》[59],2013年再版《科学前沿图谱》,不断开拓引文分析和视觉化资讯技术结合的新成果,研究出了资讯视觉化软件CiteSpace。另外学者Card,Mackinlay,Shneiderman汇编《资讯视觉化概览:用视觉思考》[60],以及《资讯视觉化:设计互动》[61]等著作大量涌现,这些科研成果直接促使新一代资讯视觉化技术在文献计量学领域形成主体地位。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。