元数据,即数据的数据,是用来描述数字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系。[34]
基于元数据的信息资源描述标准目前使用最广泛的有两种:一种是使用较早的元数据
标准——机读目录标准(MARC),一种是描述网络信息资源的元数据标准都柏林核心元数据(DC)。
1.4.2.1 机读目录标准(MARC)
MARC的全称为machine readable catalogue,中文名称为机器可读目录,是图书馆自动化系统之间传输和交换机读目录数据时共同遵循和使用的标准记录格式。它规定了书目数据在机读介质上的表示和标识方法,实现了对书目数据的描述、存储、交换、处理及检索。MARC是目前世界上历史最悠久、发展最成熟,同时使用最为广泛的一种元数据标准。
各个国家为了适应自己国家著录信息的需要,都制定了相应的MARC,故MARC的格式众多,但这些格式都是在USMARC,MARC 21,UNIMARC的基础上发展起来的,中国的机读目录格式称为CNMARC。下面分别对这四种MARC格式进行介绍。
1.USMARC
USMARC,即美国机读目录标准,原来也称为LCMARC,是由美国国会图书馆在20世纪60年代开始制定的。1966年,其制定出了MARCⅠ标准。经过一年多的试用,在MARCⅠ的基础上,美国国会图书馆于1968年又制定出了MARCⅡ标准。到1971年,美国国家标准学会批准LCMARC为《书目数据交换磁带美国国家标准》(ANSI 239.2—1971),LCMARC从此被称为USMARC。
USMARC所依据的国际标准是ISO 2709—1996《信息和文献 信息交换格式》。ISO 2709规定了机读目录记录的基本结构,它规定MARC记录由一些具有字段指示符的变长字段组成,它的结构包括记录头标区、记录目次区、记录数据区和记录分隔符。由于ISO 2709适用于各种文献类型和语言,具有很大的灵活性,因此它的颁布很快在世界图书情报界得到普遍应用,成为制定各种机读目录格式的基础。随着各文献机构自动化建设的发展,许多国家和地区以及国际组织都采用ISO 2709所规定的地区及组织的标准机读目录通讯格式。[35]
2.MARC 21(www.xing528.com)
MARC 21是由美国国家图书馆和加拿大国家图书馆于1999年在USMARC和CAN/MARC的基础上合作制定的,它是为响应网络时代而产生的一种通用的、开放性的资料格式。MARC 21包含五大部分,即书目数据MARC 21格式(MARC 21 format for bibliographic data)、规范数据MARC 21格式(MARC 21 format for authority data)、分类数据MARC 21格式(MARC 21 format for classification data)、团体信息MARC 21格式(MARC 21 format for community data)和馆藏数据MARC 21格式(MARC 21 format for holdings data)。
3.UNIMARC
UNIMARC,即国际机读目录标准,是国际图联(International Federation of Library Associations and Institutions,IFLA)于1971年开始设计的一种通用的机读目录格式,其目的是为了实现各国机读目录的共享。IFLA于1977年正式出版了《通用MARC格式》,即UNIMARC第1版,1982年出版了UNIMARC第2版,1991年出版了与之配套的《UNIMARC规范格式》。UNIMARC可以描述各种类型的文献,具有很好的灵活性,因此被很多国家和地区所使用。
4.CNMARC
CNMARC,即中国机读目录标准,由北京图书馆编制,在1992年先出版了《中国机读规范格式(试用本)》。1996年,北京图书馆对原试用本进行修订,正式出版了《中国机读目录格式使用手册》(CNMARC)。
CNMARC是依据UNIMARC编写的,遵循ISO 2709国际标准。正如《中国机读目录格式使用手册》所指出的,CNMARC“主要用于中国国家书目机构同其他国家书目机构以及中国国内图书馆与情报部门之间,以标准的计算机可读形式交换书目数据”[36]。
CNMARC虽然依据UNIMARC编写,但是根据我国信息资源的情况和用户的实际需求,增加和删减了一些字段,同时在编排格式和体系结构上也遵循了我国国家标准的编写习惯。
1.4.2.2 都柏林核心元数据(DC)
DC元数据是1995年3月在美国都柏林举行的第一届元数据研讨会上确定的13个元素的元素集,后又扩展到15个元素,即题名、主题、描述、来源、语种、关联、覆盖范围、创作者、出版者、其他责任人、权限、日期、类型、格式和标识。这15个元素具有可选择性、可重复性和可扩展性。DC元数据是在计算机和网络的自动搜索、标引、索引、检索等研究成果的基础上,充分吸纳图书情报界的分类、编目、文摘等经验发展起来的。它是描述、支持、发现、管理和检索网络资源的信息组织方式,元素的结构化和层次性是其最大的特点。它支持字段检索,提供对特定资源足够全面的描述信息,使用户不用真正链接到检索资源本身就能对信息资源有全面的了解。[37]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。