首页 理论教育 信息检索、利用与评估:定量评价的重要性

信息检索、利用与评估:定量评价的重要性

时间:2023-07-26 理论教育 版权反馈
【摘要】:定量评价相较于定性评价,更为具体、直观,更具有操作性。对于不能量化的成果和资源,不恰当地运用定量评价法,其评价结果就不会公正。定性与定量评价是评价事物的两个方面。定性评价是定量评价的基本前提,没有定性的定量是盲目的、毫无价值的定量。定量分析要在“分析评价”上下功夫,不仅要看数字本身,而且要看数字之外。CSSCI 现已成为多个地区、机构、学术、学科、项目及成果评价与评审的重要依据。

信息检索、利用与评估:定量评价的重要性

定量评价是为了确定认识对象的规模、范围、程度等数量关系,通过数据分析和数据挖掘等手段,解决认识对象“是多大”“有多少”“有多好”等问题的方法。定量评价通过系列评价指标体系的建立,可以使人们对研究成果的认识进一步精确化,以便更加科学地揭示规律,把握本质,厘清关系,预测事物的发展趋势。定量评价相较于定性评价,更为具体、直观,更具有操作性。

但学术评价不同于一般的工作评价,有些可以定量评价,有些则不能或很难量化,这在人文社会科学方面更是如此。对于不能量化的成果和资源,不恰当地运用定量评价法,其评价结果就不会公正。

定性与定量评价是评价事物的两个方面。在实际的分析评价中,二者是交替使用,互为表里和统一的。定性评价是定量评价的基本前提,没有定性的定量是盲目的、毫无价值的定量。定量的目的在于更精确地定性。没有定量的定性是一种初步、表里、笼统、含糊的定性,可以促使定性得出广泛而深入的结论。定量分析要在“分析评价”上下功夫,不仅要看数字本身,而且要看数字之外。

常用的定量评价的指标较多,包括被三大检索数据库收录、被引频次、他引频次、ESI、引文影响力、学科规范化的引文影响力(CNCI)、期刊规范化的引文影响力(JNCI)、H 指数、期刊影响因子、JCR 分区、中科院分区、核心期刊等。

1.三大检索系统收录

1987年起,中国科学技术信息研究所采用三种检索系统作为统计源进行学术排行,包括SCI(科学引文索引)、EI(工程索引)、CPCI(科技会议录索引),简称为三大检索。

三大检索系统是目前世界上可以用来对不同国家、地区的学术论文的数量进行统计分析的大型检索工具,数据可靠、准确,具有推荐作用。许多国家的科研机构将其作为科学评估研究的重要参考数据,是衡量文献的质量和水平以及在学科中的地位和作用的重要标志。在国内,众多教学科研单位在教学科研、职称评定、基金申报、奖励等多项工作中以三大检索系统作为依据。国家科学基金和青年基金申报也以三大检索工具的查询结果作为必备条件。其中SCI 已成为国内各大院校教学科研水平评估的一项重要指标,各大院校教师每年所发表的论文被其收录的数量越来越受到关注。

2.国内主要核心期刊遴选体系

目前国内有4 大核心期刊遴选体系,分别是北京大学的中文核心期刊要目总览、南京大学的中文社会科学引文索引(CSSCI)、中国科学技术信息研究所的《中国科技期刊引证报告》和中国科学院文献情报中心的中国科学引文数据库(CSCD)来源期刊。

中文核心期刊要目总览是由北京大学图书馆及北京十几所高校图书馆众多期刊工作者及相关单位专家参加的研究项目,研究对象为中文学术期刊,每四年更新一次。主要评价指标包括被索量、被摘量、被引量、他引量、被摘率、影响因子、获国家奖或被国内外重要检索工具收录、基金论文比、Web 下载量等。项目研究成果以印刷型图书形式出版,截止到2019年2月,已出八版:第一版(1992年)、第二版(1996年)、第三版(2000年)、第四版(2004年)、第五版(2008年)、第六版(2011年)、第七版(2014年),第八版(2017年)。

中文社会科学引文索引(CSSCI)是由南京大学投资建设、南京大学中国社会科学研究评价中心开发研制的人文社会科学引文数据库,用来检索中文人文社会科学领域的论文收录和被引用情况。CSSCI 遵循文献计量学规律,采取定量与定性相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。目前收录包括法学、管理学经济学、历史学政治学等在内的25 大类的450 多种学术期刊,现已开发CSSCI(1998年—2017年)20年度数据,来源文献145 余万篇,引文文献1000 余万篇。CSSCI 现已成为多个地区、机构、学术、学科、项目及成果评价与评审的重要依据。教育部已将CSSCI 数据作为全国高校机构与基地评估、成果评奖、项目立项、名优期刊的评估、人才培养等方面的重要指标。

《中国科技期刊引证报告》是中国科技信息研究所受国家科技部委托,按照美国科学情报研究所(ISI)《期刊引证报告》的模式,面向自然科学和社会科学学科的期刊,通过特定的遴选程序精选而成。该报告的数据每年更新。最新的报告为2018年版,分为《自然科学卷》和《社会科学卷》,分别收录了在中国(不含港澳台地区)正式出版的2029 种和394 种“中国科技核心期刊(中国科技论文统计源期刊)”。

中国科学引文数据库(Chinese Science Citation Database,CSCD)创建于1989年,收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术环境科学管理科学等领域出版的中英文科技核心期刊和优秀期刊千余种,目前已积累从1989年到现在的论文记录5128107 条,引文记录68194698 条。中国科学引文数据库内容丰富、结构科学、数据准确。系统除具备一般的检索功能外,还提供新型的索引关系——引文索引。使用该功能,用户可迅速从数百万条引文中查询到某篇科技文献被引用的详细情况,还可以从一篇早期的重要文献或著者姓名入手,检索到一批近期发表的相关文献,对交叉学科和新学科的发展研究具有十分重要的参考价值。中国科学引文数据库还提供了数据链接机制,支持用户获取全文。

3.引文分析法

在了解引文分析法之前,需要先了解什么是引证,以及与引证相关的概念。

引证是指用前人著作作为明证、证据,在文献计量学研究中是指科学文献之间的引证与被引证关系,也称“引用”。

与引证相关的概念还包括参考文献和引证文献。

按照GB/T 7714-2015《信息与文献参考文献著录规则》的定义,文后参考文献是指撰写或编辑论文和著作而引用的有关文献信息资源。参考文献(Reference)可以反映作者的科学态度以及论文具有真实、广泛的科学依据,在一定程度上展现了该篇文章的研究起点。对于论文作者来说,通过参考文献的罗列,避免一般性的表述和资料堆积,使论文简洁精练,同时方便区别作者的研究成果与前人的研究基础。对于科技情报人员来说,参考文献有助于进行情报研究和文献计量学研究。

引证文献(Citing Paper)是指引用节点文献的文献,也称来源文献、引用文献、施引文献。引证文献是学术论著撰写中不可或缺的组成部分,是衡量学术著述影响大小的重要因素,可从中看出作者进行知识产出的过程。文献被引证的次数越多,文献越有价值。

引证文献和参考文献之间的关系如图5-1所示。

图5-1 引证文献与参考文献的关系图

引文分析法就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

引文分析包括直接分析法和间接分析法。直接分析法是直接从来源期刊中统计原始论文所附的参考文献,并进行引文分析的方法。间接分析法是通过科学引文索引、期刊引用报告、CNKI 等引文分析工具,取得引用数据后分析的一种方法。目前常用的方法是间接分析法,即基于各种主流引文数据库和分析平台进行数据分析。

4.常用引文分析指标和概念

1)引文量

引文量是某一个主体对象含有的参考文献数量,是引文链的基本特征之一。通过引文数量的分析,可以揭示文献引证与被引证双方的相互联系,而且还可以从定量的角度反映出主体之间的联系强度。如果两篇论文或两种期刊之间的引文数量大,就可以认为他们之间的引证强度大,说明其联系紧密。

2)被引频次

被引频次可以用于评价一种期刊、一篇论文、一个作者或者一个机构,具有时间性。对于期刊而言,被引频次是指该期刊在一定时间范围内所登载的论文在特定统计时间区间被引用的总次数。对于一篇论文而言,被引频次是指该论文在特定时间段被引用的次数。对于一个作者而言,被引频次是指该作者特定范围的论文在一定时间区间的被引用次数。对于机构而言,被引频次是该机构名下所发表的论文在一定时间段内的被引用次数。被引频次反映了论文的学术影响力,是引文分析法用于学术评价最具代表性的指标,也是开展学术评价的基础。被引频次具有广泛性、公开性、公平性和客观性,受到了学术界的普遍认可,在一定程度上反映了成果的学术地位和价值。

但单纯地认为被引频次越高评价对象的学术价值越高则有失偏颇。由于被引频次是一个绝对指标,无法消除时间及规模对被引频次的影响,所以创办时间越长、论文容量越大期刊的总被引频次在理论上会高于起步较晚、论文容量小的期刊,在这种情况下仅以被引频次进行判断存在局限性。另外,不同学科之间论文的被引情况也存在着差异。统计结果显示,生物学、医学等学科的被引频次远远高于社会科学、数学等学科。有的学科由于研究领域比较窄,从事该领域或相关领域研究人数有限,反映该领域成果的期刊、出版社也有限,尽管论文、图书水平很高,即使被所有有关科学家都引用,其引用次数也不会很高。在引证中还存在着马太-波敦克效应,即在引证时作者倾向于引用知名期刊和知名作者的论文。有学者对《计算机学报》和《计算机研究与发展》上的学术论文做引文分析,发现高学术声望著者的论文在被引率、篇均被引频次和h 指数等指标上均优于低学术著者论文的相应指标,即高学术声望著者的论文在一定程度上更受关注。

简言之,被引频次是一个绝对指标,受学科领域、文献类型、出版时间、引用动机等因素的影响,具有一定的适用范围,需要慎重对待。

目前众多的全文数据库和引文数据库均可检索文献的被引频次。中文数据库包括CSCD、CNKI、维普引文库等;外文常见的引文数据库包括SCI 系列、Scopus 等,同时还可以通过Google Scholar、百度学术等搜索引擎获取评价对象的被引频次。

3)他引频次

被引频次是文章的总被引用次数,其中包括他引和自引。对于他引不同的项目有不同的标准。国家杰出青年科学基金和国家优秀青年科学基金对“他引”的定义为:文献被除作者及合作者以外其他人的引用,也就是说引用文献和被引用文献中,只要有一个作者相同,那么为自引,没有相同的作者为他引,这是一种比较严格的他引标准。此外,还有两种相对宽松的规则:一种是如果引用文献中含有被检索作者为自引,否则为他引;另一种是如果被引文献与引用文献第一作者相同则为自引,否则为他引。

4)h 指数

h 指数是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平。h指数于2005年由美国物理学家Hirsch 提出。他认为,某一文献的引用频率并不能作为衡量该文献学术影响力的指标,因为有些文献的引用完全是“自我引用”,一名科学家的h 指数是指其发表的Np篇论文中有h篇每篇至少被引h次、而其余Np-h篇论文每篇被引均小于或等于h 次。根据这一定义,将一个人发表的所有论文,让其按被引次数从高到低排列,往下核对,直到某篇论文的序号大于该论文被引次数。例如,某教授的h 指数是10,表明他已发表文章中有10 篇文章每篇至少被引用了10 次。

h 指数概念简单、易于计算,将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,可对科学家长期研究成果的影响力提供一个强有力的评估,克服了以往各种评价科学工作者科研成果的单项指标的缺点,自其被提出后,获得了广泛的认同。h 指数重点关注研究人员发表了多少有影响力的论文。因此,若你的研究没有一定的质量,没有引起学界的关注和交流,无论你发表了多少论文,都无法获得一个较高的h 指数。h 指数的测度有利于那些出精品的科学家,也可以发现哪些人是“灌水”者。在短短几年时间内,h 指数就全球风靡,很快被扩展用于期刊、研究团队、大学、科研院所、学科、国家、基金和研究热点等不同领域。

当然,h 指数也存在着一些缺点,遭受了一些质疑,主要集中在以下几点。

(1)h 指数对研究人员论文集中的被大量引用的某一篇或几篇论文并不敏感,不利于论文数量少而被引频次高的科研人员。

(2)h 指数在一定程度上依赖于科研人员的学术生涯时间,不利于刚刚从事科学研究的年轻人。这也就意味着h 指数对于从事学术生涯时间大致相同的科研人员之间才具有比较意义。

(3)根据h 指数的计算方式,科研人员的h 指数只会增加或者保持不变,不会出现下降的情况,不利于分析研究活力的衰减情况,也无法反映出科研人员的学术休止状态、退休甚至死亡。

(4)不同学科之间h 指数的差异较大,像材料科学生命科学的h 指数普遍较高,而数学、工程类则要低一些。因此h 指数不适合用于跨学科的比较。

(5)数据源会影响研究人员的h 指数。同一个研究人员在不同的数据库或者学术搜索引擎中的h 指数不同。不同数据库中h 指数的重要性也不同。

(6)根据h 指数的计算方式,h 指数的值为整数,非常容易出现h 指数相等的情况,造成区分度低。例如,有两个学者,王教授发表了20 篇论文,其中5 篇论文被广泛引用,被引频次分别为900、800、700、600、450,被引频次排名第6 的论文的被引频次为4,那么王教授的h指数为5。另一位学者李教授,发表了6 篇论文,被引频次分别为9、8、7、6、5、4,其h 指数亦为5。两位学者的h 指数都为5,仅从数值上看两位学者的影响力一样,但是从单篇论文以及论文集合的被引频次上看,王教授的被引频次远远优于李教授,因此在某种情况下h 指数会忽略论文被引频次的真实差距,需要谨慎使用。

5)ESI

ESI 是由世界著名的学术信息出版机构美国科技信息研究所(ISI)于2001年推出的衡量科学研究绩效、跟踪科学发展趋势的基本分析评价工具。ISI 资产重组后,ESI 成为汤森路透公司的一部分。ESI 是汤森路透公司基于SCI(科学引文索引)和SSCI(社会科学引文索引)所收录的全球11000 多种学术期刊的1000 多万条文献记录而建立的计量分析数据库。ESI 已成为当今世界范围内普遍用以评价高校、学术机构、国家/地区国际学术水平及影响力的重要评价指标工具之一。ESI 设置的22 个学科为:生物学与生物化学、化学、计算机科学、经济与商业工程学地球科学、材料科学、数学、综合交叉学科、物理学、社会科学总论、空间科学、农业科学、临床医学、分子生物学与遗传学、神经系统学与行为学免疫学、精神病学与心理学微生物学、环境科学与生态学植物学动物学、药理学与毒理学

ESI 通过论文数、论文被引频次、论文篇均被引频次、高被引论文、热点论文和前沿论文6 大指标,从各个角度对国家/地区科研水平、机构学术声誉、科学家学术影响力以及期刊学术水平进行全面衡量。可实现同一学科领域、同一年份出版的论文在全球范围的比较。所有统计数字每两个月更新一次。

ESI中常用的指标包括:学科基准线(Field Baseline)、ESI 高被引论文(Highly Cited Paper)、热点论文(Hot Paper)。

ESI学科基准线下包括3 个指标,分别是Citation Rates、Percentiles 和Field Rankings。

Citation Rates 是指ESI 22 个学科和所有学科不同年度发表文章的篇均被引,数据回溯10年。如图5-2所示,所有学科(All Fields)2008年的篇均被引为24.79,2015年为8.64。农业科学(Agricultrual Sciences)2008年的篇均被引为17.84,2015年为6.37。免疫学(Immunology)2008年的篇均被引为39.77,2015年为11.96。

图5-2 ESI 数据库Citation Rates 页面

Percentiles 表征了要进入6 个引用级别需具备的引用特征。这6 个引用级别分别是0.01%、0.10%、1.00%、10.00%、20.00%、45.00%。以所有学科为例,2012年要进入所有学科的前1%,被引次数需达到133 次,要进入前0.01%,被引次数要达到1345。2016年要进入所有学科的前1%,被引次数需达到44 次,要进入前0.01%,被引次数要达到374。再以生物和生物化学学科为例,2012年要进入生物和生物化学全球的前1%,被引次数需达到156 次,要进入全球的前0.01%,被引次数要达到2844 次;2016年要进入生物和生物化学学科全球的前1%,被引次数需达到47 次,要进入全球的前0.01%,被引次数要达到536 次(如图5-3所示)。从上述示例可以看出,较多的群体拥有较少的引用,较少的群体拥有较大的引用。

图5-3 ESI 数据库Percentiles 页面

Field Rankings给出了ESI数据库10年间22个学科每个学科的篇均被引和其他指标聚合的情况。以生物和生物化学学科为例,过去10年,该学科共有747535 篇论文进入了ESI数据库,总被引频次为12913467 次,篇均被引频次为17.27 次,。如图5-4所示。

图5-4 ESI 数据库Percentiles 页面

高被引论文(Highly Cited Paper):指过去10年中所发表的论文,被引频次在该学科相同发表年份的论文中排名前1% 的论文。

热点论文(Hot Paper):ESI热点论文是指过去两年发表的论文(仅限Article 和Review)中,按照同一出版时间、同一ESI 学科论文在当前更新周期的两个月内,新增的被引次数由高到低进行排序,排在前0.1% 的论文。

高被引论文和热点论文的阈值在ESI 数据库中可以检索到。以检索生物和生物化学学科高被引论文的阈值为例。先进入ESI 数据库,在选项卡中点击“Citation Thresholds”,出现Citation Thresholds的详细页面。在页面的左边,有“ESI Thresholds”“Highly Cited Thresholds”和“Hot Paper Thresholds”三个选项。ESI 阈值显示10年内前1%的作者和机构以及前45%的国家和期刊所涉及的论文的被引频次。高引用阈值显示10年内前1% 的论文被引次数的最低值。热点论文阈值显示的过去两年发表的热点论文在最近两个月内新增被引次数的最低值。按照要求点击“Highly Cited Thresholds”,出现22 个学科各年度的阈值。生物和生物化学学科进入高被引论文2008年的阈值为267 次,2015年为74 次(如图5-5所示)。

图5-5 ESI 数据库Citation Thresholds 页面

6)期刊影响因子

影响因子(Impact Factor,IF),由美国科学情报研究所创始人尤金·加菲尔德在1972年提出,指某一期刊的文章在特定年份或时期被引用的频率。

影响因子的计算方法为:某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在两年内发表的论文总数。

以2017年为例,计算某期刊在该年的影响因子:(www.xing528.com)

X被引频次=某期刊于2015 和2016年发表的论文在2017年的被引用次数

Y发文总量=某期刊2015 和2016年的发文总量

IF2017=(X(2015年,2016年)/Y(2015年,2016年))

根据计算公式可见,期刊影响因子的三个要素是时间区间、论文量和被引频次。被引频次作为分子,决定了期刊影响力的大小。发文量作为分母,可在一定程度上克服由于期刊规模、载文量大小所带来的偏差。时间区间作为一个影响变量,确保实时反映期刊的当前影响力。简言之,影响因子可以反映一定时间区间内期刊发文的平均被引率,在一定程度上表征期刊的学术影响力,现已成为国际上通用的期刊评价指标。在实际的科研评价中,影响因子的外延不断扩展,不仅用于测度期刊的学术水平,也用来表征论文的质量。由于期刊的质量是由期刊所载论文的质量水平所决定,所以反映期刊整体水平的影响因子在一定程度上可以间接反映该期刊所载论文的质量。很多科研院所、高等院校和评价机构直接把期刊因子视作论文水平高低的重要评价指标。

影响因子用来统计期刊影响力的算法并非无懈可击,其规则上的漏洞如今已经被部分期刊利用,从而提升自身的影响力。2009、2010年Acta Crystallographica A-Foundation and Advances 影响因子骤升的事情就充分反映了这情况。2009年之前该期刊的影响因子IF 常年在2 左右,由于发文量少(三年合计122 篇),2008年该刊发表了一篇综述文献A short history of SHELX,其被引频次高达69192,结果就是其影响因子在2009年暴涨至49.926,2010年继续上涨至54.333,2011年又下降到2.076。

一般来说,影响因子和期刊的学术影响力存在着相关关系,但不是线性相关关系。受学科受众面、研究领域宽窄、覆盖年等的影响,不同学科期刊的影响因子存在着差异。一个学科的引文数量,取决于学科自身的发展情况以及该学科期刊在数据库来源期刊中所占的比例。某些学科发展态势良好,在当代社会中占据重要地位,相应来源期刊就越多,该学科期刊的总被引频次和影响因子就会越大。由此不同学科期刊的影响因子和总被引频次在分布上是不均衡的。以生物科学为例,自20世纪70年代以来,生物科学的新进展、新成就如雨后春笋,层出不穷,对人类社会产生了巨大影响。许多科学家都认为,生物科学将是21世纪领先的学科之一。与之相对应,生物学期刊在SCI 期刊中的数量明显多于其他学科,总被引频次和影响因子的数量上也具有显著优势。有些学科对社会生活的影响力较小,覆盖面较窄,同类期刊的数量少、规模小,那么它就很难取得一个较高的影响因子数值。以中国科学院文献情报中心JCR 平台2018年数据为例,医学学科期刊数量为3297 本,2017年学科影响因子为3.099;农林科学期刊的数量为479 本,2017年学科影响因子为1.297。因此我们不能简单地根据数值进行比较,武断地说影响因子为4.0 的期刊优于影响因子为2.0 的期刊。

外文期刊的影响因子,可通过两个平台进行检索:一个是WOK 平台下的JCR(Journal Citation Reports),另一个是中国科学院文献情报中心JCR期刊分区数据平台(简称中科院分区)。JCR 隶属于科睿唯安集团,包括JCR Science Edition 和JCR Social Sciences Edition 两个分支,JCR Science Edition 用于查询自然科学类期刊,JCR Social Sciences Edition 用于查询人文社会科学类期刊。JCR 将下属期刊按照学科进行分类,把某一个学科的所有期刊都按照上一年的影响因子降序排列,然后平均4 等分(各25%),分别是Q1、Q2、Q3、Q4。与JCR四区均分不同,中科院分区基于布拉德福定律,引用科睿唯安的JCR 数据,将期刊分为四个分区,一区刊为各类期刊三年平均影响因子的前5%,二区刊为前6%~20%,三区刊为前21%~45%,四区刊为后51%~100%,二、三、四区的比例每年动态调整,整体上呈现出金字塔结构。

中文期刊的影响因子可通过3 种方式查找。一是通过CNKI 数据库的期刊导航查找;二是通过中国科技信息研究所每年会发布纸质版的《中国科技期刊引证报告》查找;三是中国科学文献计量评价研究中心每年以CNKI 期刊全文数据库为依托,整合和发布《中国学术期刊综合引证报告》。

7)特征因子

影响因子和h 指数考虑的均是施引文献的数量,并没有涉及施引文献的质量。被Nature 或Science 大量引用论文的影响力会大于被低水平期刊引用的论文。因此,要准确地反映期刊论文的影响力,不仅要考虑论文被引用的次数,还要考虑每条引文本身的价值。

2007年,美国科学家卡尔·伯格斯特龙(Carl Bergstrom)提出了一种新的期刊引文评价指标——特征因子(Eigenfactor Scores)。与影响因子不同,特征因子的基本假设是:期刊越多地被高学术影响力的期刊引用,其学术影响力也越高。特征因子不仅考察了引文数量,而且考虑了施引期刊的学术影响力,实现了引文数量和质量的综合评价。

与影响因子相比,特征因子在以下方面进行了调整。

影响因子的统计年限为2年,而特征因子将时间跨度调整为5年。研究表明,两年期的影响因子在不同年份的波动范围超过了20%,但五年期的影响因子则是一条相对平滑的曲线。特征因子将时间跨度调整为5年,在一定程度上避免被引频次受时间窗口影响而波动大的问题,保证了统计的准确性。

在统计范围上,科睿唯安在SCI 和SSCI 的基础上,扩大了统计范围,不仅覆盖自然科学期刊、社会科学期刊,还包括博士论文、报纸、流行杂志等。对于交叉学科期刊,更大的统计范围将使其更加公平。

特征因子剔除期刊自引数据,消除了过度自引带来的引文数据偏差,使专门依靠自引提高期刊、论文和作者影响力的方法无法实施,从而使特征因子可以更为真实地揭示研究对象的学术影响力。

特征因子计算方法基于被研究者阅读期刊时间的随机测度,并借鉴了PageRank 算法,考虑到引用期刊的影响力,即认为被高影响力期刊的一次引用可能要比被低影响力期刊多次引用更重要,因此比传统的引文分析更加合理、完善。

特征因子自问世以来已成为最受关注的期刊评价指标,科睿唯安公司也将其作为JCR的指标之一。

8)其他分析指标

(1)即年指标。

即年指标的计算公式是:某刊某年发表的论文在当年的被引次数/当年发表论文的篇数。它是用来测度期刊被利用速度的指标,也是判断期刊重要性的一个依据,是期刊质量中及时性和有用性相结合的客观评价指标。

(2)期刊自引率。

期刊自引率的计算公式是:引证该刊自己发表的论文的次数/期刊参考文献的总数。

(3)Web 即年下载率。

Web 即年下载率是指期刊在某一个期刊全文数据库中当年出版并上网的论文在当年被全文下载的次数与该期刊当年出版并上网论文总数之比。它反映了阅读频率,较好地体现了期刊在读者中的扩散程度。

(4)扩散因子。

扩散因子是一个用于评估期刊影响力的学术指标,显示总被引频次扩散的范围。具体意义为该期刊当年被引100 次所涉及的期刊数。

(5)学科扩散指标。

学科扩散指标是指在统计源期刊范围内,引用该刊的期刊数量与其所在学科全部期刊数量之比。

(6)被引半衰期。

被引导半衰期指该期刊在统计当年被引用的全部次数中,较新一半是多长一段时间内发表的。被引半衰期是测度期刊老化速度的一种指标,通常不是针对个别文献或某一组文献,而是对某一学科或专业领域的文献的总和而言。

(7)Altmetrics 指标。

Altmetrics(Alternative Metrics)是一种基于社会网络的学术影响力评价方法,国内学者将其译作补充计量学。Altmetrics 用于学术期刊社会影响力的评价,利用Altmetrics 工具收集文献管理系统和社交网络中涉及期刊发表论文的相关信息(下载量、引用次数、浏览次数、评论、转发等),然后对这些数据进行聚类分析和统计计算。

5.常用引文分析角度

2015年8月18日,中央全面深化改革领导小组会议审议通过《统筹推进世界一流大学和一流学科建设总体方案》,对新时期高等教育重点建设做出新部署,将“211 工程”“985 工程”及“优势学科创新平台”等重点建设项目,统一纳入世界一流大学和一流学科建设,并于同年11月由国务院印发,决定统筹推进建设世界一流大学和一流学科。2017年1月,经国务院同意,教育部、财政部、国家发展和改革委员会印发《统筹推进世界一流大学和一流学科建设实施办法(暂行)》。2017年9月21日,教育部、财政部、国家发展改革委联合发布《关于公布世界一流大学和一流学科建设高校及建设学科名单的通知》,正式确认公布世界一流大学和一流学科建设高校及建设学科名单,首批双一流建设高校共计137 所,其中世界一流大学建设高校42 所,世界一流学科建设高校95 所,“双一流”建设学科共计465 个。

“双一流”作为高校的发展战略规划,其目标的准确定位、方向的正确引导、政策的合理制定是建立在全面、科学认清学校所属水平、发展现状的基础上的,学科发展的规划、人才培养的方向、科学研究热点的揭示、科研绩效的有效评估等都离不开情报分析。

国内不少高校图书馆和情报分析机构基于Web of Science、Scopus、ESI、Incites、JCR等引文数据库和引文分析工具,通过文献计量统计和软科学研究方法,对多种信源的数据进行采集、选择、评价、分析、预测,开展了基于用户个性化需求和行为特征的情报服务。如华中科技大学图书馆分析了本校的学术影响力,预测了未来5年该校计算机学科的世界排名;江苏大学图书馆在论文、专利等多种类型数据的基础上,开展学科关联度分析,分析不同标准下学科划分的关联度,挖掘学科“点与全局”的关系,为学校学科调整、科研发展提供数据支撑;武汉理工大学图书馆结合ESI 数据库对于该校进行了评估;北京大学图书馆为该校43 个博士点一级学科/30 个双一流学科进行了学科竞争力分析与梳理,出具了《学科竞争力报告》;北京大学选取了该校的12 个学科,应用文献计量、关键词加权词频分析、可视化分析等方法,梳理北京大学当前的研究热点,研究分析其发展态势,出具了《学科前沿报告》,明确北京大学在世界上具有竞争优势的基础研究方向,找到实现引领学科建设与发展的可能发力点,为北京大学“双一流”学科建设提供智力支持。

总结国内高校图书馆和情报机构在学科分析上的工作和实践,主要分析的目的包括以下几个方面。

(1)学科分类评估。

在统计分析的基础上,对目标机构不同学科和二级机构进行评价与对比分析,让建设者充分了解机构各学科的发展状况,明了优势学科,发现潜在的优势学科以及尚需努力的学科。有助于建设者了解本机构学科的发展状况和建设水平,重视不同学科的建设特点,更好地开展内涵建设,支持对学科发展的经费投入和基础建设。

(2)学科态势预测与战略分析。

在区域/国家层面的发展战略指导下,配合目标机构发展战略,对学科发展趋势进行预测,辅助科研人员规划、调整学科发展发向,优化学科布局。

(3)学科前沿分析。

锁定隐含的突破性研究,提升工作创新起点,把握科学技术的方向,抢占科技制高点。

(4)学科竞争力分析。

展示全球/区域不同范围内学科的生产力、影响力、发展力、创新力,揭示学科竞争力的本质,发现适合本学科的竞争力价值和类型,围绕学科成长规律提升学科的竞争力,在省、国家、国际等不同级别形成学科的比较优势。

(5)科研管理评估。

采纳多种渠道的数据,结合多种指标,开展客观性强、可持续的科研管理绩效评估,优化科研管理流程,提升科研绩效。

(6)学术出版分析。

对JCR 等三大检索期刊等各类标准出版物进行评价,分析刊物的特点、质量及与高校的友好程度,按照学科期刊投稿指南,为科研人员快速筛选适合投稿的期刊,提高稿件命中率。

(7)创新人才评估和挖掘。

研究创新人才成长规律,建立创新驱动战略下的科研人才评价体系,优化创新人才培养和管理模式。

常见的分析角度包括引文年代分析、语种分析、文献类型分析、国别分析、作者分析、机构分析等。

(1)引文年代分析。

一般来说,随着年度的由远而近,引文量呈增长趋势,即时间愈近,被引用的文献愈多;文献被利用的峰值是该文章发生以后的第二年。如果以引文年代为横轴,各年引文量为纵轴,在坐标图上描绘各年数据点,然后用一条线连接起来,便可得到一条引文年代分布曲线。通过对该曲线的分析,不仅可以了解被引文献的出版、传播和利用情况,而且可以研究科学发展的进程和规律,特别是在文献老化和科技史的研究中,引文年代分析更是一种广泛应用的有效方法。

(2)引文语种分析。

引用文献是由不同语种的文献构成的。某一种语种的文献被引用量越大,则说明该语种比较常用和重要。考察和分析引文语种的分布,对于人们有计划地引进外文文献、译文选题、外语教育等,具有相当的参考价值。

(3)引文类型分析。

科学研究引用的文献很广,有期刊论文、图书和特种文献。对被引文献的类型进行分析,有利于确定文献情报搜集的重点。

(4)引文国别分析。

对引文国别的分析,特别是各国文献互引情况的统计分析,可以探明各国互引文献的状况,弄清国际文献交流的数量和流向。

(5)引文机构分布。

对引文机构的分析,可以探明各机构之间互引文献的状况,厘清同一学科不同机构之间交流的数量和方向。

(6)地区分布。

将论文所涉及的地区数,按全国23 个省、4 个直辖市、5 个自治区、2 个特别行政区计算,是衡量论文覆盖面和影响力的一个指标。

(7)作者分布分析。

引文按作者的分布是了解和评价某学科或专业的科技工作人员绩效的重要依据,对于客观评估机构和科研人员学术水平有重要参考价值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈