1.网络与Internet的含义
网络是利用通信线路将多台计算机连接起来,进行计算机与计算机之间的通信。按规模大小和分布范围,计算机网络可分为局域网(LAN:Local Area Network)、都市网(MAN:Metropolitan Area Network)、广域网(WAN:Wide Area Network)和互联网(Internet)。局域网就是局部区域的计算机网络,在局域网中连在一起的计算机分布范围一般在10米以上和几公里之内。因此它只是在小范围内实现资源共享的计算机网络,具有结构简单、投资少、数据传输速度快、可靠性好、保密性强等优点。广域网是在较大范围内实现计算机之间通信和数据交换,典型代表是美国的ARPAnet和NSFnet、我国的CHINANnet、CERnet、ChinaGBN和CSTnet等。这些都是Internet的基础设施。
Internet的出现是由于计算机网络的广泛应用,网络用户需要在更大范围内实现相互通信和资源共享的结果。其实质就是将若干个LAN和WAN联结成一个庞大而统一的全球计算机网络。具体而言,Internet至少有5个方面的含义:
(1)从网络互联的角度看,Internet是由成千上万个具有特殊功能的专用计算机通过各种通信线路,把分散在各地的网络在物理上连接起来而形成的一个互联网。
(2)从网络通信的角度看,Internet是一个用TCP/IP协议把各个国家、各个地区、各种机构的内部网络连接起来而形成的数据通信网。
(3)从提供信息资源的角度看,Internet是将各个国家、各个部门、各个领域的不同信息资源联为一个整体的超级信息资源网。凡是接入Internet的用户,都可以通过各种信息查询工具访问所有的信息资源,查询各种数据库,获取自己所需的各种信息资料。
(4)从网络管理的角度看,Internet是一个不受任何政府或某一个管理机构管理和约束,而是由用户互相协作的组织和集合体。从某种程度上讲,Internet是处于无政府状态之中,每一个接入Internet的用户都自愿承担网络的管理和控制,自愿遵守网络道德标准,并且共同遵守TCP/IP协议的一切规定。
(5)从信息服务的提供上看,现代的Internet能够提供广泛、多层次的、从文本信息到多媒体信息的综合性网络,为现代社会的信息交流提供了一个全新的空间(Cyberspace)。Internet已经对信息传播、教育方式、经济发展乃至文化传统、思维方式等等都产生了不可估量的影响。
2.网络信息检索及其特征
网络信息检索是指利用E-mail、FTP、Telnet、Archie、WAIS、Gopher、WWW等检索工具或协议,在Internet等全球性网络上进行信息存取的行为。网络信息检索是网络革命和信息检索发展的结果,是现代通信、计算机和信息资源各自网络化并相互连接、渗透而形成的全球性、综合性、全方位网络发展的结果。
网络信息检索与传统的联机信息检索相比,有以下几个方面的不同:
(1)两种不同的系统结构:集中式与分布式
传统的联机信息检索系统绝大多数是集中式管理的,即整个系统有专人负责维护,系统中的信息定期更新;当用户希望获得其中的信息时,用户知道向谁去申请注册、向谁索取有关资料、向谁缴付费用。通常,用户和系统的管理者都比较清楚系统中的信息资源及其查询方法等。在联机信息检索系统中,绝大部分的工作都是在主机上完成的。这样,对主机的性能要求就相当高,要求其容量大,处理速度快,功能强等。一般的信息检索系统都采用昂贵的大型主机及大容量的外存介质。这种集中式系统的主要优点是集中的安全性以及在存储设备上处理大量数据的功能。但缺点是过分依赖主机,主机一旦出现故障,则整个网络都将处于瘫痪状态;网络的扩展性和灵活性都较差。
Internet是一个由许多类型、结构不同的分组交换网通过路由器连接而成的一种庞大的、能整体运行的网络。这一网络以模块性、并行性为主要特点,信息传输的路径并不像集中式系统中是静态的,而是属于动态的,即使某一条路径被破坏了,信息包还能经由别的路径到达目的地,从而极大地提高了网络的安全性、灵活性以及资源共享。(www.xing528.com)
(2)两种不同的服务模式:主仆式与客户/服务器式
在联机信息检索中,用户提交的查询经由通讯网络后交主机进行处理,所有的工作都在主机上进行,这种运作方式称为主仆式。
在Internet中,主要采用先进的客户/服务器模式(Client/Server)。应用分前端的客户部分和后端的服务器部分,客户方借助浏览器(Web Brow ser)运行在微机或工作站上,分析从服务器上返回的数据,并且给用户显示信息;服务器方(Web Server)则运行在从微机到大型机等各种计算机上,处理用户的各种请求并提供服务;客户方和服务器方都遵循着相同的通信协议(通过它将服务器和浏览器连上Internet)。这种查询模式极大地提高了网络的利用率以及系统数据的独立性和完整性,同时,由于许多机器和操作系统都能互连起来,用户可以选择最适宜的硬件和软件环境,无论数据在哪里,用户都可以不用学习服务器环境而予以访问。
(3)两种不同的信息组织方式:普通文本和超文本
在传统的联机信息检索系统中,其数据库主要存储有关主题领域各类文献资料的书目信息,并以线性的方式来安排文档结构及其记录和字段等。这就是普通文本的组织方式。
在Internet上,信息组织则采用了超文本的方式,信息单元不是按线性序列来组织,因此它的数据库与普通文本数据库不同,其数据库不是由字符而是由节点和链路组成,节点表示知识单元、片段或其组合,链路表示这些节点间的网状关系。换言之,超文本数据库有两个部分:信息集合和连接集合中信息的链路网。超文本信息组织和检索的最大优点是人们可以沿着信息内容之间的相关关系,借助于各种有效手段任意发展延伸其思想,不受计算机一般组织文献信息的思路的限制,随心所欲地浏览与其思想有关的各种信息;同时,超文本信息的组织与检索,使得信息的形式不仅仅局限于字符,而且还可以是其他多媒体形式,信息更为丰富。但是,由于超文本技术的出发点是知识组织的非线性化,这就导致用户检索信息时注意力分散、检索结果失去整体性和全局性等缺陷。
传统的联机信息检索系统中的文本通常是经过选择、加工和标引之后,能够比较完整地描述一篇文献资料的信息集合,这样的信息集合称为二次文献。每篇这样的二次文献称为一个记录,它充分地反映了文献的内容及特征。每个记录一般都含有存取号、基本索引和辅助索引3种类型的字段。
在Internet中,检索机制是随着服务器类型的不同而不同,A rchie是用于FTP的检索工具,Veronica是用于查找Gopher的工具,Google、百度等搜索引擎则是用于WWW检索的。这些检索工具的组织有目录式和索引式。
(5)两种不同的检索结果:或优或劣,各有所长
传统的联机信息检索与网络信息检索在信息质量、检索空间、检索时效、检索费用以及检索的安全性上都有许多的差异。例如,传统的联机信息检索系统的数据库都经过严格的加工、标引,信息的附加值高,可靠性好,来源可靠,而网络上的信息资源虽然丰富,但由于没有可靠的来源和深度加工,质量参差不齐。传统的联机信息检索通常局限于某一主机的特定数据库上,而网络信息检索可以同时使用多个主机及其资源,用户也不必知道它们的具体地址,检索的空间大大增加。此外,由于联机信息检索服务是以盈利为目的,所以检索费用昂贵;Internet上则提供有丰富的免费资源。
需要说明的是,传统的联机信息检索正借助于Internet这个平台,不断改进自己的信息系统与服务方式,在新的信息环境中寻找新的生长点,增加新的服务项目与内容。两者在不断的融合中相互促进、共同发展。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。