首页 理论教育 《图情大数据》元数据标准规范

《图情大数据》元数据标准规范

时间:2023-08-08 理论教育 版权反馈
【摘要】:元数据是高度结构化的数据,其相关标准规范始于20世纪60年代的机读目录格式及其配套的著录规范和编码规范。在DCMI的影响下,国内的三大数字图书馆标准规范建设项目在元数据标准的制定上取得了丰硕的成果。元数据从功能上分为描述元数据、技术元数据和管理元数据,中国国家数字图书馆“数字图书馆标准规范体系建设”项目还包括“管理元数据规范”。

《图情大数据》元数据标准规范

元数据(Metadata)是关于数据的数据。在图情领域中,元数据一般是指对资源对象的揭示和描述,目的是实现资源的有序管理和服务,这曾经是图书馆的核心工作流程中“编目”工作产生的结果。元数据是高度结构化的数据,其相关标准规范始于20世纪60年代的机读目录格式(MARC)及其配套的著录规范和编码规范。MARC是一种计算机技术发展早期形成的数据格式,是传统卡片目录的机器可读形式,满足了图书馆在文献形式描述、内容描述、检索等方面的需要,表现为:字段数量多;著录详尽;可检索字段多;定长与不定长字段结合,灵活实用;保留主要款目及传统编目的特点;扩充修改功能强;并能在实践中不断发展完善。英国、美国为适应英语文献的需要,扩展了US-MARC及英美编目条例(AACR),为了进一步协调、促进国际交流,统一各国机读目录格式,国际图书馆联合会在US-MARC基础上制定了“国际机读目录通信格式”,即UNI-MARC,现在许多国家都采用UNI-MARC进行文献编目。中国、日本等国家根据各自情况创建了自己的机读目录,20世纪80年代推出的CN-MARC就是在UNI-MARC的基础上发展而来的。目前图书馆的大量书目数据以MARC格式储存在图书馆自动化系统中。

随着信息技术互联网的发展,多媒体资源和网络资源越来越多,MARC的描述体系过于庞大和复杂,难以适应快速灵活自动化的资源描述的需求,又因其主要用于描述印刷出版物资源,对多媒体资源和网络资源的描述能力十分欠缺。于是轻量级的只有15个核心元素的DC应运而生。DC的目的是用简单的元数据元素来描述种类繁多的电子信息,使非图书馆专业人员也能够了解和使用这种著录格式,有效地描述和检索网上资源。1995年3月,由联机计算机图书馆中心(Online Computer Library Center,OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)联合在美国俄亥俄州都柏林镇召开的第一届元数据研讨会上,产生了一个精简的元数据集——都柏林核心元素集(Dublin Core Element Set,DC),并成立了一个发展与维护DC的虚拟组织“都柏林核心元数据先导计划(DCMI)”,最开始由语义网(Semantic Web)的创始人之一Eric Miller领衔,其发展轨迹与W3C的很多做法保持一致,其设计方法和思想对国内数字图书馆建设中的元数据标准制定产生了深远的影响,例如核心集加扩展集的元数据方案设计方法,抽象模型和应用纲要的设计思想等。DC以其简单性、通用性、可选择性、可重复与可修饰性、灵活可扩展性等特点,在图书馆界和互联网上得到了广泛的应用,已经成为互联网的正式标准RFC2413和美国国家信息标准Z39.85。

在DCMI的影响下,国内的三大数字图书馆标准规范建设项目在元数据标准的制定上取得了丰硕的成果。中国国家数字图书馆“数字图书馆标准规范体系建设”项目有元数据总则、专门元数据规范——古文献、专门元数据规范——电子书刊、专门元数据规范——网络及多媒体资源4个子项目,其中总则包括应用规范、置标规范、核心元数据标准、专门元数据设计规范、CNMARC-XML、CNMARC-DC-国家图书馆核心元数据集对照转换、MARC21-DC-国家图书馆核心元数据集对照转换,专门元数据规范则涵盖了拓片、舆图、甲骨、古籍、家谱、电子图书、电子连续性资源、学位论文、期刊论文、网络资源、音频、视频、图像等。(www.xing528.com)

元数据从功能上分为描述元数据、技术元数据和管理元数据,中国国家数字图书馆“数字图书馆标准规范体系建设”项目还包括“管理元数据规范”。METS作为描述元数据、管理元数据、结构元数据的编码及转换标准,被广泛应用于数字图书馆的建设。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈