早期的数字人文研究更多的是单个或几个学者以电脑为工具,用计量方式对文学作品的文本进行分析,如Roberto Busa对St.Thomas Aquinas著作进行的大规模字词处理、陈炳藻对《红楼梦》的归属研究。随着数字人文的快速发展,数字人文的开发需要更多的专家学者、普通大众和机构参与,数字人文系统应运而生。数字人文系统是以典藏机构的数字化资源为核心,在此基础上在基金会、机构、领域专家等支持下开发的系统,系统不仅可以提供保存资料的典藏手段和寻找资料的检索工具,还可以协助研究者重新组织、分析资料,提供一个探索环境,也可以通过众包平台功能、提供API方式等与外界交互,促进学术研究共同发展。典型的数字人文系统有中国历史地理系统(CHGIS)、中国历代人物传记资料库(CBDB)、唐宋文学编年地图、上海图书馆家谱知识服务平台、南京师范大学的华夏民族家谱地理信息系统、中国台湾“中研院”的中华文明之时空基础架构(CCTS)、中国台湾历史文化地图(THGIS)、中国台湾历史数位图书馆(THDL),除此之外,早期的HathiTrust、DPLA等基础设施平台也开始提供数字人文服务。表7-1分别从系统创建的资料来源、提供的功能及工具、与外界交互情况列举了中国历代人物传记资料库(CBDB)、中国台湾历史数位图书馆(THDL)、上海图书馆家谱知识服务平台等3个较成功的数字人文系统的建设情况。
表7-1 数字人文系统建设情况
续表
CBDB由哈佛大学费正清中国研究中心、中国台湾“中研院”历史语言研究所和北京大学共建,其远期目标在于系统性收入中国历史上所有重要的传记资料,并将其内容毫无限制地、免费地供学术之用。截至2016年4月,数据库共收录约37万人的传记资料。CBDB除可作为人物传记的一种参考资料外,亦可作统计分析与空间分析之用[6]。(www.xing528.com)
THDL由中国台湾大学项洁教授团队主持,在2006年完成,2007年开放使用,其中总共包含了近9万件和中国台湾有关的官方文书和民间契约等,是中国台湾史研究资料最为丰富的资料库[7]。THDL可以帮助使用者定位资料,提供检索后分析功能,可进行诸如分类、检索结果年代分布图、词频统计等初步分析,并提供自定文件集功能和一系列分析工具帮助使用者重新组织、分析资料。
“家谱知识服务平台”由上海图书馆建立,在充分利用馆藏家谱的基础上,将家谱数字资源以“时间轴”“地图”等可视化的方式开发出来,“可见即可得”地展示某一姓氏在某一地理空间范围内的分布情况[8]。
三个数字人文系统平台有以下共同点。(1)以多来源的或单一来源的数据库内容为核心。拥有全面的、高质量的资料是数字人文建设的起点,为了适应各类人文研究的需求,不同的研究者皆需要有适合、能与之对应的数据库[9]。(2)在展示内容的基础上提供检索、分析等工具,帮助研究者从大量资料中定位所需资料,分析资料。(3)提供API接口,实现不同数据库之间、数据库与互联网之间的通联。(4)允许使用者编辑、进行自己的创作,与研究者进行对话,共建数字人文系统。这些系统平台为建设基于图书馆异构特藏资源的数字人文系统提供了参考。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。