我们对老报纸文献内容的元数据著录标准研究是从上海图书馆馆藏的《字林西报》系列报纸开始入手,工作组花了半年多的时间对馆藏《字林西报》系列报纸进行了系统的全面的内容规律调研。
1.近代报纸文献元数据研究及著录原则
基于对报纸内容知识组织的需要进行研究和实践,报纸元数据描述需要深入到文献内容,由于描述对象的时间段是解放前,揭示时重点考虑三个方面的因素:用户的需要、文献抢救和保护、内容揭示的粒度尽量细化。这三个方面也是项目研究和实践的原则。
在对上海图书馆馆藏近代报纸内容的大量调研基础上,参考现行的报刊文献元数据规范,搜集用户使用的需求,在DC的基础上,进行元素扩展和元素定义,同时采用XML进行置标。[10][11]
(1)报纸正文参考《中文新闻信息分类与代码》(GB/T 20093—2013),贴近中文报纸的体裁。
我们在调研《字林西报》系列报纸时发现,那时出版的报纸由于通信手段的落后,很多发生的新闻不能及时被报道,报道的滞后时间为一周或更长;另外,报纸的新闻很多不是报社自己采写的,有很多是通过和国际上一些通讯社签约获取的,如《字林西报》一些新闻是和Reuter签约获取的。为了让用户在检索时能方便看到新闻的来源、发生的时间和地点等,在确定元数据的描述元素时,除了常规的报纸出版日期外,我们增加了新闻来源、新闻发生地和新闻发生时间三个重要元素,这些元素在我们后来加工一些重要西文报纸时,信息揭示效果很好,如《大美晚报》等,在检索中给用户者带来了很多研究线索。
(2)广告作为重要信息资源,形成独有的著录规范。
近代报纸的广告信息同新闻信息一样,反映了当时社会经济文化发展的状况,把广告标题、广告发布者、广告语、广告类别及广告栏目等作为著录项进行著录规范,用户可通过这些著录项对广告进行检索、统计和比较分析研究。[12]
(3)图片单独著录,通过图片检索使得用户更直观地了解那个时代的发展及社会生活。
2.近代报纸文献内容篇名元数据著录规则
老旧报纸的内容基本分为两部分:正文内容和广告内容。由于报纸的部分正文内容中会附有图片,为了更方便揭示报纸数字化文本的内容,[13]本规则对中文报纸的文中图片也要求进行著录,著录图片主要为内容独立或附有文字说明的图片。[14]
老旧报纸元数据的著录分以下三种类型:
➢正文内容元数据(见表2)
➢广告内容元数据(见表3)(www.xing528.com)
➢图片元数据(见表4)
表2 正文内容元数据及著录信息源[15][16]
续表
续表
表3 广告内容元数据及著录信息源
表3 广告内容元数据及著录信息源
注:广告所属来源信息报纸名称、附属报名、日期、卷期、卷期代号、版别、页码、版次规则等同正文。
表4 图片内容元数据及著录信息源
注:广告所属来源信息报纸名称、附属报名、日期、卷期、卷期代号、版别、页码、版次规则等同正文。
表4 图片内容元数据及著录信息源
注:图片所属来源信息报纸名称、附属报名、日期、卷期、卷期代号、版别、页码、版次规则等同正文。
注:图片所属来源信息报纸名称、附属报名、日期、卷期、卷期代号、版别、页码、版次规则等同正文。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。