文献信息描述,亦称信息资源描述,是依据文献信息描述规则,对文献信息资源的主题内容、形式特征、物质形态等进行分析、选择和记录的活动。在传统的文献检索系统中,文献信息描述也被称为文献著录或信息资源编目。文献信息描述的结果,是获得信息资源的记录,即元数据,亦称款目。
元数据(Metadata)一词最早出现于美国航空航天局(National Aeronautics and Space Adm inistration,NASA)的《目录交换格式》(Directory of Interchange Format,DIF)手册中。一般认为,元数据是关于数据的数据,或关于数据的结构化的数据,或是对信息包的编码描述。例如用MARC编码的AACR2记录、DC核心记录、GILS记录,或者与XM L相关的应用系统中各种描述。
元数据具有资源描述、定位、检索、管理和评价的多重功能,是构成检索系统和检索工具的基本单元,将众多的元数据按照一定的次序组织起来就构成了一个检索系统。元数据在检索系统中的作用体现在:一方面是向用户提供信息资源的目录学信息,供使用者确认信息资源,进行选择;另一方面,元数据的各种特征也是进行信息组织的依据,是建立检索工具的前提。任何检索系统要充分发挥检索功能,都必须依赖元数据对信息资源特征揭示的准确性、规范性和完备性。
元数据已经从早期的网络资源的描述数据,逐步扩大到电子文本的描述数据以及传统出版形式的编目数据;元数据描述的规范也从20世纪70年代的文献著录标准,如《国际标准书目著录》(ISBD)、《英美编目条例》(AACR2)、《文献著录总则》(GB3792.1-83),发展到20世纪90年代一系列新描述规范,如《都伯林核心集》(Dublin Core,DC)、《政府信息定位服务》(Government Information Locator Service,GILS)等。其中最具代表性、能够适应多种信息环境的是DC。
DC最早产生于1995年在美国都伯林的第1届元数据库研讨会,在这个由OCLC(Online Computer Library Center)和NCSA(National Center for Supercomputing Applications)联合发起的会议上,52位来自于图书馆界和计算机网络界的专家学者,经过共同研究提出了DC标准。之后,通过多次研讨,DC得到不断的补充、修正并日臻完善。目前,DC描述项目分为以下15个大项,如表3.7所示。(www.xing528.com)
表3.7 DC的描述项目及其含义
续表3.7
DC、我国的《文献著录总则》等都对文献信息描述的符号和文字、描述的格式和详略级次等做了明确的规定。1997年10月,在W 3C的倡导下,DC等元数据库团体和一些著名的公司与研究机构,如IBM、M icrosoft、Netscape、OCLC、University of M ichigan等,合作制定了符合多种需要、功能强大而灵活的资源描述框架(Resource Description Framework,RDF),用以支持Internet上的元数据。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。