首页 理论教育 全国报刊索引与数字出版:上海图书馆史学情怀

全国报刊索引与数字出版:上海图书馆史学情怀

时间:2023-07-05 理论教育 版权反馈
【摘要】:上海图书馆《全国报刊索引》作为近代历史文献数字出版的专业品牌,对此不乏建树。上海图书馆《全国报刊索引》创刊于1955年,是国内最早出版发行的综合性中文报刊文献检索工具。到如今,《全国报刊索引》已由最初的纸质月刊,发展成为集印刷版、数字资源以及服务网络平台于一体的综合性信息服务品牌。

全国报刊索引与数字出版:上海图书馆史学情怀

徐华博 彭 梅(1)

大数据时代不同于传统时代,其提供的信息将改变人们的工作、生活和思维模式。历史学研究也概莫能外。

两头蛇明末清初的第一代天主教徒》(2006)的作者、台湾历史学家黄一农在研究中使用了大量数据库资源,并提出了“e考据”的史学研究方法。他认为,治史者在扎实的传统史学基础上强化利用数字资源梳理和专研史料的能力,才能无愧于科技发展对史学工作者带来的特殊条件。(2)近年来,历史文献数字化出版、研究者日益增多,史学界开始广泛关注并讨论史学数据库与历史研究的关系,如河北师范大学王文涛教授《古籍数字化资料应用与史学研究》(《史学月刊》2009年第1期)一文,便论及古籍数据库的建设及其对历史研究带来的便利。

大数据应用到历史研究之中,与传统史学研究方法相结合而诞生的“e考据”,有两个关键要素:一是数字资源;一是考据(史学研究方法)。数字出版对“e考据”的意义,在于提供海量的历史文献数字资源。上海图书馆《全国报刊索引》作为近代历史文献数字出版的专业品牌,对此不乏建树。

上海图书馆《全国报刊索引》创刊于1955年,是国内最早出版发行的综合性中文报刊文献检索工具。到如今,《全国报刊索引》已由最初的纸质月刊,发展成为集印刷版、数字资源以及服务网络平台于一体的综合性信息服务品牌。由《全国报刊索引》编辑部研发的“全国报刊索引数据库”已建成从1833年至今时间跨度一个半世纪、报道数量5 000余万条、揭示报刊数量近50 000种的特大型二次文献数据库。(3)其中,与历史研究关系密切的有“晚清期刊全文数据库(1833—1911)”“民国时期期刊全文数据库(1911—1949)”和“字林洋行中英文报纸全文数据库(1850—1951)”。

中国现代意义的报刊大约始于200年前。(4)现存可考的中国第一种中文期刊是1833年创刊于广州的《东西洋考每月统计传》。此后,随着各通商口岸的开放,西方文化的影响日益深入中国,中国知识分子也善于利用报刊这一工具发表言论、关注社会、传播新知,报刊逐渐兴盛。

由于年代久远、存世稀少,晚清期刊通常被作为古籍珍藏,不轻易示人。因此,在数字化之前,晚清期刊的利用十分困难。“全国报刊索引”编辑部推出的“晚清期刊全文数据库(1833—1911)”,立足于晚清这一特殊的历史时段,强调晚清期刊的全文数字化再现,注重这一数据库对历史学等相关学科领域的价值。该数据库收录了1833年至1911年间500余种期刊,共50余万篇文献,几乎囊括了当时出版的所有期刊。除《东西洋考每月统计传》外,还有出版于上海、由美国传教士范约翰主编的中国第一份儿童报《小孩月报》(1875—1915),中国最早的文学期刊《瀛寰琐记》(月刊,1872—1874),1898年在上海创刊的中国第一份妇女刊物《女学报》,中国最早的农业科技期刊《农学报》(1897—1906)等,不胜枚举。这些期刊无一不是学术界热门的研究对象和重要的史料来源。

民国时期,中国期刊从“报刊未分”走向了“报刊两分”。“民国时期期刊全文数据库”共收录1911年至1949年间出版的期刊2万余种,内含文献近1 000万篇,内容涉及这一时期的政治、经济、军事、外交、教育、思想文化、宗教、科技等诸多领域,分辑推出。民国时期诸多领域内的特色期刊,也可在该数据库中觅见。如论语派的《宇宙风》、鸳鸯蝴蝶派的《紫罗兰》、新月社的《新月》、左联的《萌芽月刊》、语丝社的《语丝》等,还有以《银行周报》(5)为代表的金融类期刊,以《良友》《故宫周刊》为代表的画报类期刊……

由于该数据库文献基本来源于上海图书馆馆藏民国期刊,因此其收录的期刊面貌保存较好、内容较为完整,而且涵盖了民国时期出版的大部分期刊,使之成为国内已知的收录民国期刊最为完整的数据库。

字林洋行是19世纪英商在上海创办的新闻出版机构,是当时英商在华最大的报业印刷出版集团,其旗下出版的中英文报纸等刊物,颇具规模,具体详尽地记载了中国近现代跨越百年的历史变迁,对近代上海外侨社会、中国其他通商口岸的外侨社会,乃至整个远东地区的外侨社会都具有不容小觑的影响力。(6)时至今日,尽管这些资料的文物价值、史料价值已被史学界普遍认可,但尚未被广泛挖掘。

《全国报刊索引》编辑部以上海图书馆所藏字林洋行旗下中英文报纸为基础,推出“字林洋行中英文报纸全文数据库”,收录英文《北华捷报》(The North-China Herald)《字林西报》(The North-China Daily News)《字林西报行名录》(The North-China Desk Hong List),以及中文《上海新报》《沪报》《汉报》《消闲报》,共计55万余版。

《北华捷报》(1850—1941)由奚安门(Henry Shearman)创办于1850年8月,最初是一份4页周报,用于记录当地新闻并传播海外传来的消息,内容以广告、外侨名录和贸易船运统计信息为主。该报售价并不低廉,非连续订阅者为50美分每份,连续订阅者为25美分每份,预付费订阅3个月需4美元,半年为8美元,1年为15美元。奚安门也因此被誉为极具商业头脑之人,可以说服他人购买他推出的报刊。(7)1863年8月,《北华捷报》内容涵盖了《航运与商业新闻》(Shipping and Commercial News)的内容摘要,1864年变成了广为人知的《字林西报》。

1868年1月,字林洋行推出《最高法院与领事公报》(Supreme Court and Consular Gazette),该报于1870年1月与《北华捷报》合并成《北华捷报与最高法院和领事公报》(The North-China Herald and Supreme Court&Consular Gazette)。顾名思义,合并之后的《北华捷报》包含了上海租界工部局官方修订的法律信息等,内容更为丰富,体量也更为庞大。(8)内容的扩充和版式的更张,不仅有助于增加《北华捷报》的销量,也有助于记录更多的历史信息,为相关领域研究者提供了便利。

《字林西报》(1864—1951)由《航运与商业新闻》发展而来,前期以航运和商业新闻为主,订阅者也多为与之相关的洋行等商贸公司。随着上海通商口岸的发展,报纸的体量也有所变化,内容愈加丰富,包含商业报告、传教士报告、读者来信、本埠新闻、外埠新闻以及远东乃至世界各地的新闻等。同时,因字林洋行与上海工部局关系之密切,《字林西报》一如1926年戈公振在《中国报学史》中所评论的那样,有上海“工部局之喉舌”“英人在东方之唯一言论机关”之称。由于太平洋战争爆发,该报曾于1942—1945年期间被迫停刊。

根据《字林洋行百年纪念刊》(North-China Daily News&Herald,Ltd.Centenary Supplement)的报道,《字林西报行名录》创办于1865年,以取代并扩充《北华捷报/字林西报》上刊登本地外侨名录这一职能。《行名录》是一种长条状的书籍,主要记载上海以及各大通商口岸商行、企业、机构信息,该出版物最初每年出一本,后来随着各通商口岸外侨流动性的增大以及洋行经营和人事变动的频繁,每年增出一本修订版。

除英文刊物外,字林洋行也曾出版中文报刊。其中,《上海新报》创办于1861年,由传教士任主编,是在上海出版的第一份中文报纸,曾在当地新闻界独树一帜。《沪报》创办于1882年,由时任《字林西报》主笔巴富尔发起,戴普生、蔡尔康等报业华人任主笔,由于有字林洋行强大的新闻网络为后盾,该报一度更名为《字林沪报》,并与《申报》《新闻报》呈三足鼎立之势,1900年被出让给日本东亚同文会,后更名为《同文沪报》,成为该会在华机关报。《消闲报》是《字林沪报》的副刊,随《字林沪报》附送,内容多关乎文学,也兼及其他;该报曾更名为《同文消闲报》《消闲录》等,被认为是中国最早的中文报纸副刊。《汉报》1893年创办于汉口,原名《字林汉报》,是外国人在中国内地发行的第一份中文报纸,因其鼓吹维新,所以1900年在清廷颁布严查康党的上谕后被迫停办。

海量近代报刊的数字化,便利了新闻史、报刊史以及其他近代史领域的研究。在已出版的数字资源基础上,《全国报刊索引》编辑部以建设海量近代报刊数字资源为己任,将整理馆藏文献与挖掘馆外文献相结合,进行近代文献资源的海内外补缺以及合作共建,为社会大众和专业研究人员提供最优质的近现代史报刊数字出版服务。

海量数字资源的利用,离不开网络服务平台。《全国报刊索引》网络服务平台致力于提供其推出的一系列数据库的知识服务,方便读者进行资源获取。为了提升用户体验,提高服务质量,《全国报刊索引》编辑部在2015年进行了服务平台的升级改造,新平台当年年底正式推出。此次升级改造,重点改善了三项主要功能:

(1)文献检索方面。

《全国报刊索引》的数字资源,并非简单的图像扫描,而是对其中的客观内容有所揭示,方便读者进行普通检索、高级检索以及专业检索等多元检索。普通检索,指读者可使用一般检索功能对自己拥有权限的数据库资源进行任意检索。读者可选择需要检索的二级资源类型(如近代期刊、现代期刊、中文报纸、英文报纸、行名录、会议等),至少选择1项,亦可多选;同时,可根据需要选择正文、图片、广告或者全部资源类型等条件进行检索。高级检索,指读者可针对一个或多个有权限的数据库资源进行条件组合方式的高级检索,平台默认选择读者具备权限的所有数据库资源,读者也可对数据库资源进行自主选择。此外,读者需选择一种文章类型(如正文、图片、广告),根据需要进行检索字段的AND、OR、NOT组合,直到达成所需的检索条件。同时,可根据需要添加检索条件进行“精确”或“模糊”检索,也可进行二次检索(如重新检索、在结果中检索、在结果中添加、在结果中去除)。专业检索,指读者可针对多个数据库资源进行条件组合方式的高级检索;平台默认选择读者具备权限的数据库资源,为读者提供醒目而详细的使用帮助。读者可点击使用帮助,查看专业检索模块的相关使用说明,自行输入检索条件进行检索。

现以“民国时期期刊全文数据库”和“字林洋行中英文报纸全文数据库”中的英文数字资源为例,阐述《全国报刊索引》在近代报刊数字资源内容揭示方面所做的努力和贡献。

《全国报刊索引》编辑部从2002年开始进行馆藏民国期刊资源的数字化建设,尤其重视民国期刊客观内容的挖掘与呈现,对每份民国期刊以及其中每篇文章的客观信息,如期刊信息(刊名、创刊年月、出版地等)、篇名信息(题名、作者、出版年、出版卷期)等进行有效揭示。以杜亚泉发表于《东方杂志》1912年第9卷第5期的《论切音字母》为例,在普通检索中,“民国时期期刊全文数据库”的使用者可以通过文章标题检索到此文献,也可通过作者名检索浏览其发表文章的概况,亦可通过其刊名了解该刊发表文章的情况。在高级检索中,使用者可以通过文章题名“论切音字母”AND作者“杜亚泉”AND文献来源“东方杂志”的方式,精确找到所需文献;亦可在专业检索中自行输入检索条件,查阅该文。

“字林洋行中英文报纸全文数据库”中的英文数字资源包括《北华捷报》《字林西报》和《字林西报行名录》。其中,前两种属于英文报刊;后一种形式较为特殊,与年鉴类似。

《北华捷报/字林西报》基本分为三部分:正文、图片和广告。正文主要指新闻、航运信息、通告、政府或法院的公报、编辑部来信以及其他内容,该数据库使用者可以对正文的题名、作者、文献来源等信息进行检索。图片主要指该报刊登的照片和漫画,可对图片名称和责任者进行检索。广告主要指该报刊登的各类个人或机构(包括公司与政府机关等)发布的广告,可对广告标题、广告发布者进行检索。

由于《字林西报行名录》的正文内容形式特殊,别具一格,无法采用《北华捷报/字林西报》这一英文报刊的检索模式,《全国报刊索引》编辑部专门为其研发了一套检索模式,对其正文进行检索。行名录的正文内容主要指其刊发的机构信息。以1917年的字林洋行为例,其在行名录中的英文行名为“North-China Daily News&Herald,Ld.”,行名地址为“17 The Bund”,当时该洋行机构负责人为“Pearce,E.C.Morriss,H.E.Morriss”。数据库使用者可通过中文行名、英文行名、机构负责人等信息进行检索。

正因为有这些专业的客观内容揭示,才方便了历史研究者查阅数字资料,进行历史叙事和史实铺陈。以字林洋行为例,其在上海百余年间几易主管,屡迁其址,行名录对洋行机构信息的逐年记录,可以为史家描绘其百年来的辗转变迁提供有力证据。(www.xing528.com)

目前,已有研究者利用“晚清期刊全文数据库”和“民国时期期刊全文数据库”进行孙中山佚文研究,他们利用数据库资源专业的客观内容揭示,梳理了孙中山的著述、对孙中山行踪的报道、时人与孙中山相关的论说以及其他关乎孙中山的杂文等内容。(9)随着《全国报刊索引》近代报刊数字资源的使用率越来越高,诸如此类的成果亦会越来越多。

(2)文献聚类方面:数据统计、聚类分析

基于多元的文献检索功能,《全国报刊索引》的服务平台对跨库检索结果进行了数据统计聚类分析。可进行聚类分析项有“数据库来源”“文献来源”“作者”“年份”等,数据分布年份还被制成可视化图表供读者参考。出版时间的聚类提供了可视化柱状图,点击其中一个时间段上的柱形图,检索结果会随之变化。

(3)文献导航方面:整本浏览、完整呈现。

平台为读者提供了“首字母导航”“资源类型分类导航”和“检索”导航三种模式。读者可通过导航功能浏览每种期刊的年、卷、期,并对所需期刊进行单期的整本浏览和篇名浏览。整本浏览功能宛如翻阅书刊实物,读者可全面浏览期刊信息,完整地看到期刊封面、排版、版本等细节,有助于报刊史和版本学的研究。篇名浏览功能完整罗列了所选单一卷期中收录的所有文章篇名,一目了然。

早在20世纪末国际学术界就曾兴起一股建设历史资料量化数据库进行研究的热潮,国内则有所滞后。(10)《全国报刊索引》为史学研究者提供海量历史文献数字资源,在方便学者进行“e考据”的同时,亦能促进计量史学的发展。

基于海量历史数字资源的平台检索和聚类功能,便利了依靠定量分析进行史实揭示、历史认识和经验归纳总结的计量史学研究。计量史学是20世纪50年代以来受到社会科学的影响而形成的一种历史学的研究方法。60年代以后,“电子计算机的广泛应用,极大地推动了历史学研究中的计量化进程”(11)。而美国经济史学在20世纪50年代完成了由“历史主义”(即在特定的历史阶段与具体的政治、文化及社会语境中考察经济问题)到“计量方法”的转变。(12)该研究方法在美国、法国兴盛后,扩展到了西欧其他国家、日本以及拉美等地,并于20世纪80年代前后传入中国。经过30余年的发展,计量史学在中国当代经济史、社会史、人口史等研究领域得到了相应的应用,并以其定量分析的科学性客观性推动了相关研究领域的发展。(13)计算机技术的发展以及史料资源的数字出版,为计量史学创造了一个新的发展时机。

历史学家不可避免地经常运用到计量的概念,历史学界也日益关注量化方法在史学研究中的运用。(14)如,抗日战争史研究中有关中国两个战场的战绩、中国抗战对世界反法西斯战争的贡献,以及中国在抗战之中的人口和财产损失等若干问题的量化研究,推动了该领域研究的发展。(15)这不仅表明了数据资源的量化分析为人文社会科学领域研究带来的便利,而且也彰显了这一量化分析对人文社会科学领域研究的推动作用。

《全国报刊索引》近代文献数字资源建设的意义也在于此。作为上海图书馆近代报刊文献数字资源服务品牌,它旨在对重要报刊历史资源进行保护性开发利用,依托上海图书馆丰富的馆藏资源,优先选取对历史学等人文社会科学意义重大的报刊资源进行数字出版。在近代报刊图像扫描的基础上,运用各种现代化的数字技术,如云计算、大数据、语义技术,对数字资源进行内容分析和基于数据间内在逻辑关联的知识组织,进而提供面向内容和知识的精准服务,挖掘客观知识,节省研究者的时间,增加近代报刊的利用率,从“e考据”与计量史学的角度助力文史研究,促进历史研究方法的创新,彰显其在数字出版中的史学情怀。

(1) 作者单位为上海图书馆。

(2) 参见黄一农:《两头蛇:明末清初的第一代天主教徒》,上海古籍出版社2006年版,“自序”第7页。

(3) 参见“全国报刊索引”:http://www.cnbksy.com/shlib_tsdc/article/frontForm.do?articleId=38。相关数据为“全国报刊索引”编辑部的最新统计。

(4) 李玲:《从刊报未分到刊报两分——以晚清报刊名词考辨为中心》,《近代史研究》2014年第3期。

(5) 《银行周报》是中国近现代史上创办最早、刊期最长的一份金融类期刊,1915年春由中国银行、交通银行等7家银行共同创办,1950年3月停刊,记录了这一时期中国金融业的发展历程,深受金融史研究专家的重视。该刊存世稀少,《民国时期期刊全文数据库》共收录了1 484期,61 923篇文章,几乎完整收录。

(6) 汪幼海:《〈字林西报〉与近代上海新闻事业》,《史林》2006年第1期。

(7) A Century of Endeavour with Much of Achievement,North-China Daily News&Herald,Ltd.Centenary Supplement,1950-08-03(1).

(8) A Century of Endeavour with Much of Achievement,North-China Daily News&Herald,Ltd.Centenary Supplement,1950-08-03(25).

(9) 参见王杰、张金超:《孙中山佚文注疏——以晚清民国期刊全文数据库为中心》,《近代中国》(第二十四辑),上海社会科学院出版社2015年版,第151—170页。

(10) 梁晨、董浩、李中清:《量化数据库与历史研究》,《历史研究》2015年第2期。

(11) [英]罗德里克•弗拉德:《计量史学方法导论》,王小宽译,上海译文出版社1997年版,“译者的话”第1页。

(12) 关永强:《从历史主义到计量方法:美国经济史学的形成与转变(1870—1960)》,《世界历史》2014年第4期。

(13) 王爱云:《计量史学方法在当代中国史研究中的运用》,《当代中国史研究》2013年第6期。

(14) 李伯重:《史料与量化:量化方法在史学研究中的运用讨论之一》,《清华大学学报(哲学社会科学版)》2015年第4期。

(15) 袁成毅:《抗日战争史研究中的若干“量化”问题》,《抗日战争研究》2010年第1期。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈