首页 理论教育 化学发展:国际主要科研机构论文共现现象研究

化学发展:国际主要科研机构论文共现现象研究

时间:2024-01-19 理论教育 版权反馈
【摘要】:论文中的这种“共现”现象,可以从多角度揭示隐含在论文中的各种信息。本研究以化学领域20个国际主要科研机构的论文数据为样本,通过分析机构-机构、机构-关键词、关键词-关键词三种“共现”现象,探讨用文献计量学方法挖掘机构间合作关系、潜在的合作网络及其共同关注的研究主题,定量描述科研机构的发展动态,为管理决策部门了解科学前沿和重要研究方向,以及制定相应的战略规划提供参考。

化学发展:国际主要科研机构论文共现现象研究

本文刊载于《科学观察》2006年第1卷第5期P10-P17。

如果您喜欢,欢迎订购我刊

* 重大基础研究前期研究专项(项目编号:2004CCC00400),国家软科学研究计划(项目编号:2003DGQ1K240)

作为国家科技创新体系的重要组成部分,各国的大型科研机构(科研院所、高校)在提升国家创新能力、加强科技竞争力方面发挥着关键作用,成为引领世界科技发展潮流的主力军。考察科研机构发展及运作规律,对发挥其潜能、缩短科研周期、提高科研效率有着重要的现实意义。

论文作为科研成果的主要载体,蕴含着大量的信息。因此,对科研机构发表的论文数据进行挖掘,可以揭示诸多的机构活动特点和发展规律。多篇论文之间共同出现的主题,共同出现的合作机构、共同出现的合作者等在论文与论文之间构筑起来的学术关系是分析科研机构基本状态和竞争能力的重要方面。论文中的这种“共现”现象,可以从多角度揭示隐含在论文中的各种信息。本研究以化学领域20个国际主要科研机构的论文数据为样本,通过分析机构-机构、机构-关键词、关键词-关键词三种“共现”现象,探讨用文献计量学方法挖掘机构间合作关系、潜在的合作网络及其共同关注的研究主题,定量描述科研机构的发展动态,为管理决策部门了解科学前沿和重要研究方向,以及制定相应的战略规划提供参考。

大规模科学论文数据库是文献计量学方法的重要研究基础。学术论文一般以单独记录的形式存在于数据库中,一条记录代表一篇论文,每条记录分别用多个特征项来描述论文的外部和内部特征,如题名、作者、关键词、机构等等。共现(co-occurrence)是指特征项描述的信息共同出现的现象。通过对共现现象的定量分析,可以揭示信息的内容关联和特征项所隐含的知识。

研究者很早就对存在于同一特征项的共现现象有所认识,并进行了大量的理论与实践探讨,如:论文共引(cocitation[1~5]、论文耦合(bibliographic coupling[6~8]、共词(co-term, co-word[9~12]、共篇(co-publication)[13~15]被用于归纳研究主题,追踪科学前沿。此外共现现象更普遍地存在于不同特征项之间:如通过关键词- 年代共现,可以考察研究主题随年代演变的轨迹;通过期刊- 作者共现,可以挖掘期刊作者的发文规律;通过作者- 关键词共现,可以分析作者研究主题的差异。

对共现现象分析使用最多的方法是统计共现频次,生成共现频次矩阵。由于共现频次量纲的差异对进一步的统计结论影响较大,需要进行矩阵归一化,其中用得最多的是Jaccard 系数[2]ochhia 系数[14],之后对归一化的相似矩阵进行聚类或因子分析,进而挖掘出论文数据中各种相关关系。

化学,作为自然科学的基础学科,其研究成果已经渗透到人类生活的方方面面,有力地推动了社会的迅猛发展。本研究以化学学科为例,依据美国科学信息所(ISI)基本科学指标(EssentialScience Indicator, ESI2006 5月公布的数据,按照SCI 被引总频次排序,遴选出在化学领域影响力较大的TOP20机构,作为国际主要科研机构的代表,以“PY=(2004-2005) ANDAD=(*AND CHEM)”为检索式,在WEB OFSCIENCE 中下载了20个机构20042005年两年的论文数据(见表1)。从三个角度观察“共现”现象:机构-机构共现、机构-关键词共现、关键词-关键词共现。

合作研究是大科学时代的重要特征之一。高水准、广泛的学术合作是一流科研机构撷他人之长,保持自身竞争力不可或缺的手段。最典型的机构合作方式是两个或两个以上的机构共同署名发表科研成果,即“机构-机构共现”。对20个优势机构的共现频次进行统计,形成20×20共现频次矩阵,为了消除机构频次数量的差距对结果的影响,首先对矩阵进行了归一化处理,利用统计学软件SPSS对归一后的矩阵进行处理:选择皮尔逊相关法(Pearson)距离测量点间距,组间距离(BetweenGroupsLinkage)为类距离,用等级聚类法聚类,得到聚类树形图(见图1)。

从图1可以看出,化学领域的机构合作呈现出两个主要特点:第一,高校机构间合作具有鲜明的地域性日本机构(东京大学、东京科技研究所、京都大学、大阪大学)、美国机构(得克萨斯州立大学、明尼苏达大学,加州大学伯克利分校、加州理工学院)内部合作的强度很大。毫无疑问,选择地理位置邻近的本国机构进行学术合作具有很大的便利性,可以节省大量的时间和财力资源,有利于本国的资源共享,提高科研效率。第二,科研院所间的合作在跨国层面上进行,它们之间的合作频率高于同高校之间的合作。俄罗斯科学院、马普学会、意大利国家研究委员会、法国科研中心和中国科学院分别是所在国家的大型科研机构,具有规模大、实力强的特点。在图1中这些机构自成一簇,凸显了代表国家队水平的大型研究机构相互之间的密切合作关系,在某种程度上说明了这些研究机构更具有共同感兴趣的研究内容。

为了进一步观察20个机构间合作的种群情况,本项研究还利用SPSS的多维尺度分析(MDS),生成机构间合作关系的二维平面图(见图2)。从图2 可直观地看到依据20个机构的合作密切程度而划分成的四个小组,它们既松散又紧密地分布在四个象限中:组间距离较大,而组内则关联较强。由此可见,化学领域机构的合作选择性很强,同组内部合作伙伴关系紧密,合作频繁,而不同组间则可能由于研究内容、背景等差异,合作很少。其中,中国科学院在合作网络中的位置较为特殊:在图1中,中国科学院与俄罗斯科学院、马普学会、意大利国家研究委员会、法国科研中心同属一组,但关联较弱。降维后的MDS 图进一步揭示出,中国科学院不仅远离其他的合作小组,而且游离在本组边缘,合作关系不如本组其他机构之间那样紧密,表现出中国科学院在化学领域合作伙伴的选择相对分散。

合作研究要真正起到增强机构的科技实力的作用,不仅要强强合作,更要强项合作。甄别合作机构研究内容、项目特点,了解自身优势,找到合作基点,才能做到有的放矢,并能从合作中受益。论文的关键词是科研成果内容最直接的表达形式,通过“机构-关键词共现”频次矩阵,对化学领域20个机构依据其关键词的相似程度进行聚类,可为机构制定科研合作战略提供参考。本项研究首先选择了词频在40次以上的关键词96个,对“机构-关键词共现”频次进行统计,生成20×96的矩阵,采用与3.2相似矩阵处理方法对20个机构进行聚类分析,生成若干个类(见图3),并借助多维尺度分析方法生成MDS图。依据聚类分析的结果,对MDS图进一步处理(见图4)。

显然,有频繁合作关系的科研机构在研究内容上往往会具有很大的相似性,如日本的京都大学、东京科技研究所、东京大学、大阪大学表现出较强的合作关系,在研究主题上也同样呈现出相似性。然而,较少合作的机构间也可能存在研究领域的相近。图3 可以看出,在化学领域研究中,俄罗斯科学院与四个日本机构所从事的研究主题很相近,而在图1机构合作图中,它们之间的合作关系很弱。与此类似,学术合作较少的中国科学院与京都大学、东京科技研究所、东京大学、大阪大学、得克萨斯州立大学研究内容比较接近,显然它们之间有着良好的合作基础和前景。

4中,不同的圈代表图3 聚类分析中不同的类,共五类,其中有四个类只有一个机构,分别是哈佛大学、美国斯克利普斯研究院、加州理工学院、法国斯特拉斯堡第一大学。这些机构的一个共同特点就是在化学领域的论文数量相对较少,分别列论文数量排名的第13181920位(见表1)。而剩余的其他机构(16个)都隶属第五类。前四类机构的研究内容与第五类有较大差异,体现了这些机构在确定研究方向时往往以自身资源优势为基本出发点,力争研究重点突出,走特色发展的道路,从而形成了在MDS图中分散四周的局面。相比之下,第五类机构则位于MDS图的中心位置且聚在一起,表明所从事的研究内容比较相似。科研机构在制定发展规划时既要密切关注研究主题相似、有潜在合作基础的机构,重视同它们的学术交流与合作;又要充分考虑自身特点,了解那些研究内容相去较远的机构,争取实现优势互补,有针对性地选择合作伙伴和追踪竞争对手。

此外,同图2的四组机构分散排列相比较,图4 中绝大多数机构组间距要密集得多,这说明在化学领域,20个机构间合作关系相对松散,而在研究主题上却要集中得多。在竞争无处不在的当今世界,科研工作亦不能避免。无论合作关系的强弱,高水平的科研机构都会共同关注到某些重要的研究领域。

敏锐、超前的选题是科研成功的基础。实践证明,优秀的科研机构往往具备一流的科学鉴赏能力,在研究中会不约而同地准确把握科学发展的脉络,共同关注到一些重大研究课题。

WEBOF SCIENCE 数据库中,作者给出的关键词是其研究主题的重要体现。由于单个关键词难以完整地表达某个研究主题,因而本研究对20个机构化学领域论文数据中高频关键词- 关键词共现矩阵进行聚类分析,用一组关键词来表达特定的研究主题,进而锁定这些机构共同聚焦的研究内容。

在下载的论文数据集中,共出现关键词34441个(规范后),其中词频高于40次以上的96个,约占总词汇量0.25%,占总频次的42.2%。对96个词经手工处理、判断,删去含义宽泛、不明确的关键词,保留38个,生成关键词-关键词38*38的共现矩阵,对矩阵进行聚类生成聚类树(见图5)。

对图5聚类形成的关键词簇进行分析,形成若干个研究主题(见表2),每个研究主题包括若干个关键词,这些研究主题是20个机构聚焦的研究内容。

2列出的主题反映了化学领域近年来发展的大致脉络,给科研人员选题、机构决策提供了参考依据。其中,既有一些近年来新兴、热门研究内容,如有关纳米材料的化学性质测定(123),又有一些属于具备一定研究规模、发展相对稳定成熟的主题(45678),充分反映出主要科研机构的科研选题,从国家经济社会发展和国家安全出发,以战略性、全局性和长远性为立足点,重视求真探源,不忽视基础研究,又着眼于开拓重要前沿领域的战略眼光。

建立开放、协作的学术研究机制是造就一流科研机构的必经之路。只有了解科研机构的学术合作现状、规律和模式,掌握本国机构的科研合作状况,管理者才能制定出符合自身特色的科研合作战略。(www.xing528.com)

通过对化学领域主要机构论文数据中机构-机构共现现象的分析,描绘出机构间实质合作的网状关系图,从而揭示了主要机构间合作的规律和特点。20个机构的数据分析表明,在大科学研究的背景下,跨越机构和国家的学术合作与交流日渐频繁。合作在两大阵营内部分别展开:高校之间的科研合作比较密切,并表现出很强的地域特色,如日本机构(东京大学、东京科技研究所、京都大学、大阪大学),美国机构(得克萨斯州立大学、明尼苏达大学,加州大学伯克利分校、加州理工学院)内部合作紧密;而俄罗斯科学院、马普学会、意大利国家研究委员会、法国科研中心和中国科学院等大型科研机构则打破国家界限,合作频率较高。对这种合作特点的充分揭示和认识是了解国际主要机构间合作规律,认清本机构合作现状的基础,这对进一步拓宽科研交流领域,丰富交流内涵,深化学术研究,制定合作战略规划有着重要意义。

本研究通过对机构- 关键词共现矩阵的分析,用定量的方法全面展示了基于研究内容的潜在机构合作网络:共性的研究内容越多的机构,相似度越大,距离越近,除去那些有着较多实质合作关系的机构,其余机构显然有着良好的合作前景,但成为竞争对手的几率也越大;反之,对那些研究内容存在差异的机构,要给予充分关注,寻求知识与能力的互补。总之,在竞争与合作共存的科学共同体中,区分研究内容相近或相异的机构群,有利于更好地甄别竞争对手和合作伙伴,有利于机构间学术资源整合,避免重复建设、实现优势互补、提高科研效率,从而真正推进合作向纵深发展。

良好的开端是成功的一半,瞄准研究前沿和重要领域,选择具有战略意义的题目,开展深入、系统的创新性研究工作,是取得重大科研成果的前提和基础。各国主要科研机构由于拥有优越的科研环境、汇集了大批优秀科学家、具备雄厚的研发资金,因而引领着世界科学主流研究方向,关注它们所从事的研究工作,是全面深入了解本学科重大科学问题和主要研究内容的途径之一。

对关键词-关键词共现矩阵的聚类分析,可以建立起单一关键词之间的关系,最终实现用一组关键词来完整表达一个研究主题或内容。基于20个机构论文的高频关键词聚类形成的研究主题,大致反映了20个机构共同关注的焦点,也反映了当代化学领域主流研究内容的轮廓。对这些研究主题的准确把握,可以深入了解本学科的发展的概况和动态,发现重要的研究方向、热点研究内容,提高自身科研鉴赏能力。在此基础之上,科学家可以考虑从不同角度对重要科学问题进行探索;管理机构可以针对本国已有较好基础和积累的重要研究领域制定政策鼓励开展持续、深入、系统的创新性研究工作,为进一步实现有限科技资源的合理化配置打下基础。

在论文的构思、写作过程中,金碧辉研究员提供了重要的研究思路和非常有价值的修改建议,课题组的张望同志在数据处理、分析方面给予了鼎力协助,作者在此表示最诚挚的谢意!

[1]Small H. Co-citation in the scientific literature: a new measure of therelationship between two documents. Journal of the American Society for InformationScience, 1973,24(4): 28~31

[2]Small H. Structural dynamics of scientific literature. InternationalClassification,1976, 3(2):67~74

[3]Small H. A co-citation model of scientific specialty:a longitudinal study ofcollagen research. Social Studies of Science, 1977,7:139~166

[4]Small H. Clustering the science citation index using co-citations.Scientometrics, 1985,7(3): 391~409

[5]Small H. Tracking and predicting growth areas in science. Proceedings of ISSI2005, 1:13~23

[6] 庞景安.科学计量研究方法论.北京:科学技术文献出版社1999

[7]Glanzel W, Czerwon HJ. A new methodological approach to bibliographic couplingand its application to the national, regional and institutional level. Scientometrics, 1996, 37 (2): 195~221

[8] Sharada BA, Sharma JS. A study ofbibliographic coupling in linguistic research. Annals of Library Science andDocumentation,1993, 40 (4):125~137

[9] Callon M, Courtial JP, Laville F. Co-wordanalysis as a tool for describing the network of interactions between basic andtechnological research: the case of polymer chemistry. Scientometrics,1991, 22(1):155~205

[10] Law J, Whittaker J. Mappingacidification research: a test of the co-word method. Scientometrics, 1992, 23(3): 417~461

[11] Raan AFJV, Tijssen RJW. The neural netof neural network research: an exercise in bibliometric mapping.Scientometrics,1993, 26(1):169~192

[12] Law J, Courtial JP, Bauin S, et al.Policy and the mapping of scientific change: a co-word analysis of research intoenvironmental acidification. Scientometrics,1988, 14 (3-4): 251~264

[13] 崔雷,郑华川. 关于从MEDLINE 数据库中进行知识抽取和挖掘的研究进展. 情报学报,2003224):425~433

[14] 郑华川,崔雷. 胃癌前病变低频被引论文的共词和共篇聚类分析. 中华医学图书情报杂志, 2002,11(3):1~3

[15] 罗式胜. 科学文献关键词的概念——一种统计分析方法. 情报学报,1994,132):126~131 

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈