郑 星(1)
今天,大数据技术不仅在政治、经济、文化、科技等领域产生重要的影响,而且给社会带来认识和生活方式的巨大变革。大数据作为当前历史学研究的一种全新视野,不仅仅体现为各种新样态史料的广泛使用,更表现为运用各种自然科学研究领域常用的计算机信息处理技术对历史文本信息进行深入的挖掘和分析。(2)因此,大数据视域下的历史学研究不仅扩展了历史学研究的广度和深度,而且丰富了历史学研究的工具与手段,成为新时期历史学研究的一个发展趋向。
随着互联网和信息技术的迅猛发展,科研模式和用户信息需求与信息行为都发生了重大变化,表现尤其明显的是学术期刊在推进学术发展、促进学术交流、引领学科建设等方面发挥着举足轻重的作用。因而,从大数据视野全面合理有效评价学术期刊的影响力越来越受到相关科研人员的关注。《中国历史地理论丛》创刊于1981年,专门刊载我国历史地理学研究成果及译介国外历史地理学理论和最新研究动态,已经成为国内历史地理学研究的重要阵地,也是同类期刊中较有影响力者。本文将以文献计量学的理论与方法,从定量的角度对近10年《中国历史地理论丛》所载论文进行大数据分析,通过各项数据指标揭示学科发展趋势,探究其学术影响力。需要指出的是,本文可能存在以下不足:一是因样本所限,不能涵盖全部相关学术著作和论文集;二是文中数据基于笔者所在单位的网络资料和研究文献,相关信息可能存在一定的滞后。尽管如此,以大数据方法分析近10年《中国历史地理论丛》所载论文仍不失为当前了解国内历史地理学研究状况的最佳方式,其统计数据亦有重要参考价值。
对近10年《中国历史地理论丛》所刊论文数量的统计,有助于了解该期刊发展趋势和研究脉络。由中国知网(CNKI)检索可知,近10年《中国历史地理论丛》共刊载文章799篇,各年数量分布如下图所示。
图1 近10年《中国历史地理论丛》所刊论文数量示意图
总的来看,近10年《中国历史地理论丛》所刊论文数量自2005年开始保持平稳发展,其间虽然偶有波动,除了2005年论文数量相较其他年份较多,但是整体论文数量并没有出现大幅度的减少,表明近10年来《中国历史地理论丛》刊载论文数量保持综合稳步发展的趋向。
通过对各种基金项目的量化统计,可以大致了解国家各级部门对历史地理学研究的资金投入和重视程度。在近10年《中国历史地理论丛》刊载的799篇文章中,有176篇文章受到国家和各级部门的基金资助,占近10年文章总数的22.03%,各年分布状况见下表1。从该表可以看出,近10年来《中国历史地理论丛》所刊载的基金资助文章数由少至多,由早期的不受重视、获资助的文章数量少到目前受资助的文章数量飞速增长,近年更是显著上升,表明国家和各级部门对国内历史地理学研究的日渐重视。
表1 近10年《中国历史地理论丛》刊载文章基金资助情况
上表数据显示,获基金资助的文章不多,这可能是因为我国历史地理学研究早期并没受到应有的重视,也可能与本文样本较少以及项目初始有一定的关联。2011年后,受基金资助的文章不断涌现,尤其是近三年其比例明显增加。从基金的类型上看,以国家哲学社会科学基金、国家自然科学基、国家级其他基金、教育部基金等为主,省、市和地方其他基金资助数量相对较少,但仍表明近10年在国家基金资助下我国历史地理学研究取得了长足发展。
高被引论文作为评价科研工作者科研水平的重要标准,是指被引频次高,能够反映论文学术影响力的高质量论文。(3)根据CNKI统计的近10年《中国历史地理论丛》刊载文章被引次数前十名来看(如表2所示),单篇文章被引次数最高的为37次,被引频次超过30次的有5篇文章,并且被引频次排名前十的文章发表于2005年到2008年之间。而近10年《中国历史地理论丛》刊载文章被引次数前十名者,主要研究历史聚落地理、历史经济地理、历史医学地理、历史政区地理以及历史自然地理等方面。其中,王杰瑜的《明代山西北部聚落变迁》一文被引频次最高。该文对明代山西北部长城沿线的军事聚落形成、发展以及变迁进行考察分析,认为清代山西北部地区聚落的发展和繁荣与明代该地区大量军事聚落的存在密不可分。
其他高被引频次的文章还有不少,如:陈为忠的《近代山东经济格局变迁研究——以港口与腹地互动为视角》,以19世纪60年代的山东沿海港口与腹地互动为视角,论证了由于腹地与非腹地之间的差异以及腹地内部劳动地域分工的不同而造成的当时山东地区经济发展的失衡,认为这种失衡对现在山东地区经济地理产生了巨大影响;龚胜生、叶护平的《魏晋南北朝时期疫灾时空分布规律研究》,通过各种文献数据统计了魏晋南北朝时期我国疫灾的地理分布状况,认为当时黄河中下游地区、淮河流域和长江中下游地区是疫病的主要流行区域;庄华峰的《古代江南地区圩田开发及其对生态环境的影响》,通过大量历史文献资料研究了古代江南地区圩田开发历程,认为随着时代变迁,过度地开发圩田已经对江南地区的水文环境造成了巨大破坏,致使该地区自然灾害频发,生态环境问题严重;马顺平的《明代陕西行都司及其卫所建置考实》,依据地方志等考证了明代设置陕西行都司诸卫所的时代背景,指出明代对河西走廊的完全控制其标志应该是陕西行都司设甘州为其治所。总之,透过对表1的数据分析可以看出近10年我国历史地理学研究在各个方面都取得了丰硕的成果,不仅在传统历史地理学研究领域,而且在历史聚落地理、历史医学地理等领域也开拓了新局面。需要指出的是,表1中所显示出的近10年《中国历史地理论丛》刊载文章被引次数前十名文章都出现在2005年到2008年,其后6年并没有出现这样的研究热潮,也未涌现大量高质量的学术文章。
表2 近10年《中国历史地理论丛》刊载文章被引次数前十名一览
续表
根据表3,在近10年《中国历史地理论丛》刊载文章的作者中,发表文章数排名靠前的有10位,其中发表文章数超过5篇的有5人,他们来自不同的科研机构,且这些科研机构发表文章数量也较多。其中,满志敏发表11篇,吴宏岐发表9篇。一个明显的问题是,满志敏虽然发表文章数量最多,但是其被引用次数却少;而辛德勇近10年在《中国历史地理论丛》发表文章虽只有6篇,但却有一篇被引频次较高的文章。此外,通过对近10年《中国历史地理论丛》刊载文章高产作者的分析,可以清晰地看出满志敏、吴宏岐、杨煜达、郭声波、辛德勇等5位是近10年国内历史地理学研究领域的代表人物。
表3 近10年《中国历史地理论丛》刊载文章高产作者
为反映近10年《中国历史地理论丛》刊载文章作者的出现频率以及合著情况,笔者利用SATI及其内嵌的社会网络可视化软件NetDraw进行分析。从图2可见,近10年《中国历史地理论丛》刊载文章作者的合著情况不但较为零散,而且高产作者的合著情况并不多见,某种程度上反映出近10年来国内历史地理学研究仍旧处于单打独斗的局面,缺乏良好的团队运作。相比之下,满志敏与其他作者合著次数较多,而且合著文章为9篇,形成了一个有影响力的社会网络。
图2 近10年《中国历史地理论丛》刊载文章作者合著关系网络图
作者发文机构指的是作者发表文章时所署的单位名,对作者发文机构的统计分析有助于清晰直观地了解我国历史地理学研究机构的地域分布和地区关注度。本文利用SATI工具对近10年《中国历史地理论丛》刊载文章的EndNote文件进行发文机构字段抽取,然后进行频次统计,得出出现频率前13名以及发文篇数大于等于7篇的学术机构共有24个,如表4所示。
表4 近10年《中国历史地理论丛》刊载文章主要发文机构分布情况(www.xing528.com)
从表3统计的数据可知,复旦大学和陕西师范大学共发文248篇,占近十年《中国历史地理论丛》刊载文章总数的31%,表明其间这两所院校是我国历史地理学研究的重镇。复旦大学拥有教育部首批人文社会科学重点研究基地——历史地理研究中心,陕西师范大学拥有教育部百所人文社会科学重点研究基地——西北历史环境与经济社会发展研究院,这是两所院校能够取得众多历史地理学成果,成为我国历史地理学研究重镇的重要原因之一。排在前13名的学术机构除了北京市社科院外,其余都为高等院校,而且大部分都是国家重点高校,表明高校在国内历史地理学研究中起着重要推动作用。从排在前13名的学术机构地域分布情况来看,全国历史地理学研究机构分布范围广,但北京、上海、广州、西安、武汉等地是相对比较集聚的地区,其中西北地区、华北地区、华东地区和华南地区分布更为集中,这种分布特征与文章高产作者所在机构的分布状况大致吻合。
关键词是表明文章研究方向的重要指标,可以其在众多文章中出现的频率高低作为判断该词所代表某一领域研究热点的线索。(4)也就是说,可以运用高频关键词共现网络分析的方法来研究近10年《中国历史地理论丛》所刊载文章关键词出现频率,进而分析其间历史地理学领域的研究热点。
表5 近10年《中国历史地理学论丛》刊载文章中出现频次最高的前40个关键词
从这40个关键词来看,“历史地理学”“清代”“历史地理研究”“历史时期”“唐代”是出现频率较高的五大关键词。由表5可见,近10年我国历史地理学研究趋向四个方面:一是对不同历史时期我国历史地理状况的研究;二是对我国地理学史以及不同历史时期历史地理文献的研究;三是对我国历史时期生态环境变迁进行深入的考查;四是对我国历史地图集的订正以及地名和古都的考证。关键词频次排在后20名者,则集中体现出近10年来历史地理学界对历史时期政区沿革和城市发展以及水道变迁进行了重点的关注。通过对这40个关键词的分析可以发现,近10年历史地理学研究围绕着不同历史时段的环境变迁、行政沿革、历史地理文献等展开,说明近10年来这些研究方向是历史地理学界的主攻方向,同时也是目前历史地理学研究的重中之重。
利用SATI提取近10年《中国历史地理论丛》刊载799篇文章中共计2 783个关键词,经过进一步的数据分析可知,其中出现频次大于等于6次的关键词共有40个。运用社会网络分析软件Ucinet对排名前100名的高频关键词进行点度中心性测算,并提取其中排名前40位者与相对应高频关键词进行比对分析,如表6所示。点度中心性主要是指某关键词和其他关键词之间如存在联系,那该关键词就处在核心位置,其绝对中心度数值越高,就表明其节点越重要。
表6 近10年《中国历史地理论丛》刊载文章中高频关键词点度中心性测算值
通过表5与表6的对比可知,近10年《中国历史地理论丛》刊载文章中出现频次最高的前40个关键词中有12个出现在点度中心性的前20之中,表明高频关键词在网络中的地位举足轻重。再利用可视化分析工具NetDraw对这些关键词进行可视化分析,如下图3所示。数据可视化是指运用计算机图形学和图像处理技术,将数据转换为图形或图像,并进行交互处理的方法和技术。当两个以上的关键词出现在同一篇文章中,两者之间便有了一次连线,出现的频率越高,其连线次数也就越多,联系也就越紧密,那么这些关系紧密的关键词便是文章研究的热点问题。
图3 近10年《中国历史地理学论丛》刊载文章中高频关键词中心性可视化
通过表5的统计和表6的测算可以发现,近10年我国历史地理学研究热点除了传统的历史自然地理和历史人文地理外,还侧重于历史时期环境变迁、城市历史地理以及历史地理文献的整理和研究。
通过定量分析的方法对近10年《中国历史地理论丛》所刊载799篇文章按照发表时间、基金资助情况、作者出现频率、论文被引频次、发文机构分布等因素进行大数据分析,可以很大程度反映我国近10年历史地理学研究的三个特点。
第一,近10年《中国历史地理论丛》刊载论文数量保持平稳发展,其间虽然偶有波动,但是整体论文数量并没有出现大幅度的减少,大致可分为两个阶段。第一个阶段为2005年至2009年,该阶段《中国历史地理论丛》刊载论文数量略有减少,但是整体数量并没有出现下滑。第二个阶段为2010年至2014年,此阶段论文数量稳步增加,趋于平衡,没有出现数量下滑的迹象。这两个阶段文章数量的起伏也反映出基金资助在背后起到的重要作用,二者之间的互动关系尤为明显。从2010年开始基金资助的力度显著增长,而随之《中国历史地理论丛》刊载论文数量也明显增加。从资助的情况来看,基金资助是明显增长的,其中以国家社科基金和国家自然基金资助比例最大,基金资助级别较高,而地方基金资助相对较少,表明近10年来我国历史地理学研究得到稳步发展与国家对该学科的重视和不断的基金资助是密不可分的。
第二,近10年我国历史地理学研究形成了一个相对稳定的作者群,以满志敏、吴宏岐、杨煜达、郭声波、辛德勇五位为代表的高产作者,为历史地理学的发展做出了贡献。从作者所在的科研机构来看,北京、上海、广州、西安、武汉等地是历史地理学研究学术机构相对比较集聚的地区,而复旦大学和陕西师范大学又是其中有代表性的重镇。
第三,就近10年国内历史地理学研究热点而言,通过对关键词出现频率情况分析中可知,其间历史地理学研究围绕着不同历史时段的环境变迁、行政沿革、历史地理文献等展开,说明近10年来这些研究方向是历史地理学界的主攻方向,同时也是目前历史地理学研究的重中之重。此外,近10年的研究热点除了传统的历史自然地理和历史人文地理外,还侧重于历史时期环境变迁、城市历史地理以及历史地理文献的整理和研究。
另外,本文努力试图从大数据视角考察近10年我国历史地理学研究的特点与趋势,但是将文献计量学的方法应用到实际的分析研究中难免会存在不足之处,尤其对近10年《中国历史地理论丛》的大数据分析,由于只涉及文章而没有涉及各种历史地理学著作,难免会顾此失彼,影响数据统计的完整性和最终统计结果。无论如何,总的来说,本文仅仅对近10年《中国历史地理论丛》所刊载的文章做了大数据视野下的文献计量学分析,希望能让更多的研究者了解近10年国内历史地理学的发展趋势,以期为学术研究与学科发展提供参考。
(1) 作者单位为西北师范大学。
(2) 吴玲:《大数据时代历史学研究若干趋势》,《北方论丛》2015年第5期。
(3) 参见张诗博:《2004—2008年国内图书馆学研究高被引论文的统计与分析》,《情报科学》2011年第3期。
(4) 参见黄小燕:《情报领域研究热点透视——情报领域论文关键词词频分析(1999—2003)》,《图书与情报》2005年第6期。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。