1.现有文献分类法在网络信息资源组织中的应用
传统文献分类法经过上百年的发展,体系已经相当完善,在信息资源组织方面发挥着重要的作用,在网络信息资源分类中也具有自己的优势。目前许多网站或搜索引擎都在一定程度上采用了现有文献分类法来组织网络信息资源。
(1)《杜威十进分类法》的应用
DDC正式出版于1876年,最新一版是2003年7月出版的第22版。DDC按照传统的学科分类,总共以10个主要的大类(Main Classes)涵盖了人类所有的知识体系,如表3.3所示。
表3.3 DDC基本类号与类目
在大类之下再细分为若干类(Divisions)和小类(Sections)。通过数字标记、号码层次等,逐步形成其类目等级体系。类目系统合理、标记易于理解等优点使得DDC在网络信息资源组织上也有广泛的应用。利用DDC比较成功的网络信息资源目录有加拿大图书馆的Canadian Information by Subject,美国北德克萨斯州立大学图书馆的The World W ide Web Reference Collection,美国密苏里州公共图书馆的Internet Resources in Dewey Decimal Order,以及The Mathematical A tlas、BUBL Information Service、Cyber Dewey、WW lib Browse Interface等一些特色网站。
(2)《国际十进分类法》的应用
UDC是1899年在《杜威十进分类法》的基础上逐步扩充而成的,并被翻译成20多种语言,出版了详略不同的许多版本。现有几十个国家的10万多个机构采用它进行分类标引和检索。UDC的主表在9大类的基础上,采用等级列举式方法进行逐级展开。UDC在网络信息资源组织方面的应用有:NISS Information Gateway,这是英国图书馆界的一个合作项目,目的是为英国教育界和科研领域提供全球信息服务;SOSIG(Social Science Information Gateway),是一个有关社会科学的网络目录,它使用UDC社会科学部分的类目来组织网络信息资源;BUBL Subject Tree,覆盖了英国国内综合性的网上资源;German Harvest Automated Retrieval and Directory,目标是建立整个德国的网络资源检索与浏览工具。
此外,由美国依阿华大学开发的CYBERSTACKS项目,Internet Collegiate Reference、 Collection Cooperative Online Resource Catalog等都采用了美国《国会图书馆分类法》(Library of Congress Classification,LCC);我国的“网络指南针”按照《中图法》将网络信息分为22大类。(www.xing528.com)
2.网站和搜索引擎自编的分类系统
目前,许多网站或搜索引擎采用自编的分类系统对网络信息资源进行分类组织。这些自编的分类系统大致上分为等级式主题分类法、组配分类法和学科分类法3种类型。1993年,美国的费罗和杨致远(David Filo & Jerry Yang)采用宽泛的主题领域建立分类索引,通过分析与综合的方法建立了Yahoo! 综合性主题指南(http://dir.yahoo.com/)。这是最早以网络信息资源为对象的分类语言和分类目录。Yahoo!分类法包括A rts & Humanities、Business & Economy、Computers & Internet、Education、Entertainment、Government、Health、New s & Media、Recreation & Sports、Reference、Regional、Science、Social Science、Society & Culture等14个一级类目。之后,新浪(http://dir.sina.com.cn/)、搜狐(http://dir.sohu.com/)、网易(http://search.163.com)等都建立了自己的分类目录体系。
与传统文献资源的分类方法相比,自编分类系统具有以下特点:以网络信息资源的主题而不是文献内容的学科属性作为聚类的主要依据;类目(包括“子类”、“网站”和“网页”等)收录范围广、排列方式简单;网络分类可以采取多个而不是单一的体系,这种多重列类便于用户多角度查寻和浏览;直接以语词而非符号标识组织信息;网络分类更新迅速,类目名称和注释上也更加简明、实用等。这些特点使自编分类系统得到了广泛的应用。
自编分类系统的缺陷表现在:
(1)分类体系不严密。某些网站和搜索引擎在划分类目时并未真正从知识体系的角度来划分,而更多地是从商业角度来考虑,从而破坏了分类体系的系统性和完整性。
(2)类目之间缺乏逻辑性。在部分网站和搜索引擎的分类体系中,许多类目之间缺乏逻辑性,隶属关系紊乱,某些上、下位类之间、类列之间都缺乏合理的知识联系。
(3)类名不规范。主要表现为类名不统一,类名用语不准确,类名不能准确地概括类目的内涵等。
(4)类目划分的标准不一致。由于类目设置采用多重划分,一些类目下往往使用两个或多个分类标准,有的甚至在同一层次上列出不同等级的类目。
要解决这些问题,必须充分考虑网络用户的需要和网络信息资源的特征,充分借鉴传统的文献分类法和已有的自编分类系统的经验、技术和成果,从而尽可能使网络信息资源的分类能够满足对网络上各种信息组织的需要,能满足各类用户浏览查询信息的需要,能揭示信息内容的相关性,对搜索到的信息进行必要的控制和过滤,力争把分类浏览检索与使用自然语言的专指检索结合起来。
一般来说,网络类目体系的建立首先要根据网站性质,以“主题和专题” 作为聚类的主要标准,同时以学科和专业作为辅助标准。一级类目通常以10个~20个为宜,除了社会科学、科学技术、经济、教育等之外,还应把网络信息丰富、查询率高的列入一级类目,如休闲娱乐、生活服务、计算机与互联网等。在一级类目下,根据信息的相关性展开分类体系,分类层次基本控制在3级~6级之间。由于网络分类语言是面向最终用户的,因此必须科学和人性化地设计查询界面。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。