计算机的出现使人类处理信息的能力步入了一个崭新的阶段。随着当今社会各领域的迅猛发展,信息以爆炸的方式不断增长,而且种类相应繁杂,除了文本、数字之外,图形、图像、声音、视频等多媒体的信息也大量涌入信息处理领域,使人们感到现有的信息存储与检索机制越来越不足以使信息得到全面而有效的利用,尤其不能像人类思维那样通过“联想”来明确信息内部的关联性,而这种关联可以使人们了解分散存储在不同信息块之间的连接关系。现在的信息之多,相互关系之复杂,甚至连该学科的专家也不能全部掌握。就像美国作家D.Pember在“Mass media”(大众传播媒介)一文中描写的那样:“我们可能已经发现了一种治疗癌症或心脏病的方法,我们可能已经找到摆脱时空限制的途径,我们可能⋯⋯,这种种问题的答案细分为成百上千个部分,以点滴信息的形式分散在世界各地,有待于搜索起来、联系起来。”因此,我们迫切需要一种技术或工具,它可以建立并使用信息之间的链接结构,使各种信息能够得到更广泛的应用。近年来不断发展起来的超文本(Hypertext)和超媒体(Hypermedia)技术,就有希望使我们达到这样的目标
超文本和超媒体是信息处理领域中的一个全新的概念,本章将简单地介绍超文本和超媒体的有关概念。
§8.1.1 超文本
1.什么是超文本
超文本这个术语是美国的Ted.Nelson在60年代提出来的,它是一种信息管理技术,或者说是一种电子文献形式。为了便于理解什么是超文本,我们先把超文本和传统文本(text)作个比较。
所有传统的文本,包括印在纸上的和存在计算机文本文件里的,都是有顺序存放的。例如书,就是从第一页顺序到最后一页,一篇文章接着一篇文章。而人类的思维结构与文本结构具有不同的特点。科学研究表明,人类的记忆是一种联想式的记忆,它构成了人类记忆的网状结构,对联想记忆的探索形成了人类思维的概念化的基础,人类记忆的这种联想结构不同于文本的结构,文本最显著的特点是它在信息组织上是线性的和顺序的,这种线性结构体现在阅读文本时只能按照固定的线性顺序先读第一页,然后读第二页、第三页⋯⋯,这样一页一页地读下去,例如:读一本侦探小说,对小说里每个情节,每个案子都非得一口气从头读到尾,方能弄清案子的前因后果与来龙去脉。这就是线性文本,即它作为一种线性组织表现出贯穿主题的单一路径。但人类记忆的互相网状态结构就可能有多种路径,不同的联想检索必然导致不同的路径。例如,某人对“夏天”一词可能产生下面一系列的联想结果:
夏天→游泳→海→鱼→吃饭→饭盒→餐具→银器→耳环→婚礼→婚纱→白雪
尽管人们对“夏天”一词有相同的概念,也有同样的文化和受教育的背景,但一个人在不同时间,或是不同的人在同一时间,所产生的联想结果却是千差万别的。例如几天后问一下那个人对“夏天”一词的联想如何,可能会得到这样的答案:
夏天→太阳→星星→天文学→望远镜→伽利略→比萨→斜塔 佛教→和尚
显然,这种互联的网状信息结构用文本是无法管理的,必须采用一种比文本更高层次的信息管理技术,即超级文本技术。
不同的人读同一本书有不同的想法,因而产生不同的活动,即使同一个人,不同时间读同一本书也会有不同的想法和不同的活动。人的思维是联想型的,人们习惯于根据联想思维采取相应的行动。例如:人在阅读书籍时,特别是学习知识或做研究时,常常要同时阅读与该书有关的参考书。以阅读《多媒体计算机技术》一书为例,读者A第一次接触“多媒体”这个词,就去书中查有关这个词的定义与解释;并可能去查找更多的有关“多媒体”的参考文献资料;看到作者名是钟玉琢,就翻到作者简介,了解作者的有关情况;书中提及Apple公司,就去查Apple公司的有关信息,阅读感兴趣的资料⋯⋯。读者B对“多媒体”有所了解,所以他不用弄清“多媒体”的定义,对作者也已了解,就直接阅读正文,书中提到DVI系统,读者B想详细了解,就转去读参考文献[5]中“DVI系统中视频音频获取器的原理和设计”,然后,再继续读那本书⋯⋯
如果用超文本技术组织一本书,就和传统的正文文件或印刷的书籍不同。所有正文(文章、段落,或一句话、一个词)都按相互间的联系被组织成正文网。因此,这本“书”就无所谓第一页和最后一页,从哪一段正文开始阅读,以及接下来读什么,都由读者根据需要来临时决定。选择“下一段”正文的基础既不是顺序,也不是索引,而是正文之间的联系。所以,超文本技术采用的组织和浏览方式更符合人的思维方式及习惯。
简而言之,超文本是一种按人脑的联想思维非线性地存储、管理和浏览文字信息的技术。
2.超文本的一般结构
超文本目前还没有统一的结构,但无论结构简单或复杂,系统的基本组成都是节点(Node)和链(Link)。节点用于存储信息,链用来表示信息之间的关系,用户可以根据这些关系进行浏览。节点和链的类型多种多样,类型不同,组织管理方法也不同,因而形成了不同的超文本系统。
(1)节点
在目前已有的超文本模式中,最常见的节点有正文节点、图像节点、声音节点、图形节点。此外,还有混合节点(如文字和图片混合)、正文索引节点、对象节点、规则节点等等。正文、图像和声音节点可以互相补充说明同一个对象,对象节点可以用于表示某些知识,可以链接超文本以外的对象系统,规则节点存放推理用的规则。
(2)链
在超文本中可以定义的链的类型很多,最常见的是导航链。例如名称链(节点间的关系通过名字链接)、聚焦链(节点B放大节点A)、全景链(聚焦链的反)等。此外,还有组织推理链,如索引链、属性链、组成链、隐含链。隐含链用于链接推理树中的事实,索引链链接正文索引节点和相应的索引项。
各种类型的节点已经使超文本成为一种日常灵活的知识表示工具,再加上节点之间各种类型的链接关系,就更进一步提高了超文本的表达能力和灵活性。节点和链的类型的复杂性和灵活性决定了超文本的复杂性和灵活性。
(3)网络超文本结构类似于人类的联想记忆结构,是采用一种非线性的网状结构组织块状信息,没有固定的顺序,也不要求读者必须按某个顺序来阅读。采用这种网状结构,各信息块很容易按照人们的“联想”关系加以组织。例如,一部百科全书有许许多多的“条目”,它可以按照字母次序进行排列,也可以按照各专业分类用链加以连接,以便于人们“联想”查找。一个完整的小型超文本结构如图8-1所示。
图8-1 一个完整的小型超文本结构
从图中可以看到超文本是由若干内部互联的文本块(或其它信息块)组成,这些信息块可以是计算机的若干屏,也可以是若干窗口、文件或更小的块信息。这样一个信息单元就称为一个节点(Node)。不管节点有多大,每个节点都有若干指向其它节点或从其它节点指向该节点的指针,这些指针称为链(Link)。链有多种,它连接着两个节点,通常是有向的,从一个节点(称之为源节点)指向另一个节点(称之为目的节点)。链的数量通常不是事先固定的,它依赖于每个节点的内容。有些节点与其它点节有许多关联,因此它就有许多链;有些节点没有启程链,它就只能作为目的节点。超文本的链通常连接的是节点中的有关联的一部分而不是整个节点。例如,在图中可看到链源在节点的局部区域或某个单词,而它们的目的地却是整个节点。当用户主动点触该词时将激活这条链而迁移到目的节点。
图8-2 一个六节点九条链的小型超文本结构示意图
图8-2所表示的超文本结构实际上就是由六个节点和九条链组成的一个网络。
读者可以在上述这个作为浏览和导航用的网络中主动航行,这里要强调的不仅仅是“阅读”,而更重要的是可以主动地决定自己阅读节点的顺序。假如读者是从标记为A的文本块开始阅读,与单一路径的文本不同,该超文本结构有三条阅读路径摆在读者面前,即可到B、D或E。如果读者选择B,则可以继续选择到C或E,从E又可以到D。当然,读者也可以从A选择直接到D。这个例子表明,在超文本结构中任意两节点之间可以有若干条不同的路径,读者可以自由地选择最终沿哪条路径阅读文本。这同时要求超文本结构的制作者事先必须为读者建立一系列可供选择的路径,而不是单一的线性路径。
传统印刷文本中的脚注和有许多交叉参考的百科全书,同超文本的结构很相似。对于有脚注的文本,当读者遇到一个脚注时,可以作出不同的选择,或者继续阅读正文,或者追踪脚注。百科全书就更加典型了,读者可以根据自己的理解程序和兴趣追踪条目中所含的条目。在条目或词中常会遇到“参见”,读者循此指示便找到适当的卷和适当的条目,而在这些参见的条目中又可能出现“参见”,因此,阅读的逻辑路径就构成了一个网络。
3.超文本结构的特点
无论百科全书和脚注与超文本结构多么相似,超文本与它们有着本质的区别,这就是超文本充分利用了计算机的特点。现代大百科全书中,相互参照往往要在几十卷大部头书之间来回查阅,显然速度很慢、十分费时。超文本文献用不到一秒种的时间就可以提供下一个节点,而且它容纳的信息量可以印刷成千百册图书。同时,一般出版物多限于文字和图形,而超文本节点还可以提供声音、图像、动画、动态视频,甚至计算机程序。一般文献的组织和相互参照结构在印刷时就已经定型,而超文本的链和节点则可以动态地改变,各个节点中的信息可以更新,可将新节点加入到超文本结构中,也可以加入到新链路中来反映新的关系,形成新的组织结构,从老的文献中产生出新文献。
一般典型的超文本系统还具有一个用于浏览节点,防止迷路的交互式工具即浏览器,或称导航图。它是一个超文本网络的结构图,与数据中的节点和链一一对应。导航图可以帮助用户在网络中定向和观察信息是如何连接的。在一个由千万个节点组成的超文本网络中,寻路是很常见的事情,这时浏览工具就显得十分重要,它可以帮助用户在网络中导路、定位。这种良好的交互特性,只有计算机才可能实现,传统印刷文本只能望洋兴叹了。
因此,可以这样认为:超文本是一种信息管理技术,它以节点作为基本单位。这种节点要比字符高出一个层次。抽象地说,它可以是一个信息块;具体地说,它可以是某一个字符文本集合,也可以是屏幕某一大小的显示区。节点的大小由实际条件决定。在信息组织方面,则是用链把节点造成网状结构,即非线性文本结构。其顺序、层次则是一种特殊的简单的网状结构。随着计算机技术的发展,节点中的数据不仅仅可以是文字,而是可以是图形、图像、声音、动画、动态视频,甚至计算机程序或它们的组合。这最终又形成了超媒体的概念。
§8.1.2 超媒体——多媒体超文本
如果所管理的信息不仅仅是文字,而且有图像、图形、声音等其它媒体信息,那么,这种技术又称为超媒体(Hypermedia,超媒介,超介质)。实际上,超媒体就是超文本加多媒体。一个超媒体系统必定采用的是超文本技术,所以也可以称为超文本系统。但一个超文本系统如果只有文字信息,则不能称为超媒体系统。
以往的信息处理大量是单媒体的,然而,在现实世界中,任何事件和物体的表现都是多方面的,仅有文字和数字是不够的,往往还要面对大量的图形、图像等各种形式的信息数据。因此,只有用多媒体信息才能比较为接近人类的表达方式去表现复杂而丰富的信息。但多媒体信息与传统的单媒体信息有很大的不同。它的数量巨大,媒体名类繁多,而且处理复杂,有许多在单媒体信息处理时并不突出的问题,而在多媒体处理时则急需加以解决。如各种数据混合在一起组成信息的表达形式是什么?各种不同媒体信息之间的关系是什么?如何找到一个特定媒体的数据?各种媒体的信息如何综合表现?等等。由于超文本的节点与链的形式可以容易地推广到多媒体的形式,可以基于包括不同媒体的节点,所以它自然地成了支持多媒体信息管理的天然技术,同时多媒体信息的引入在某种程度上又为超文本带来了不同凡响的效果。
早期超文本系统的表现形式即用户“显示”界面仅是文字的,这就是它被称为TEXT的原因。后来由于工作站的广泛应用,使图形、点阵化的图像引入到超文本节点之中,便可以用多媒体化的形式表达信息。随着多媒体技术的发展,各种各样多媒体接口的引入,使仅用显示来表达信息的形式扩展到用视觉和听觉甚至触觉来表现。多媒体的表现是具有特定含义的,它是一组与时间、形式和媒体有关的动作定义。先进的多媒体表现的交互式特性可提供给用户控制表现过程和存取所需信息的能力。多媒体信息的组织将有助于信息的表达和交互。多媒体和超文本的结合大大改善了信息的交互,多媒体的表现又可使超文本的交互式界面更为丰富。例如瑞典的AVICOM公司设计了一个用于斯德哥尔摩自然历史博物馆的多媒体超文本系统“自然世家”。它具有传统超文本的全部特性,节点包含多媒体数据。比如在对若干行政区域介绍中,配有行政区域地图,并附带介绍了生活在那里的各种鸟类。当用户激活某种鸟的名称时,就会出现这种鸟的照片同时伴有它的叫声。这个超文本系统还能控制一台幻灯机,把一幅背景图像放映在观众站立的地板上,例如当系统在介绍整个斯德哥尔摩地区尚处于水下的地质时代时,背景便是一片蓝色的海洋。这种技术都使用户有身临其境的感觉。
正是由于多媒体信息引入超文本,有人就提出用超媒体来强调他们的系统是多媒体的。也有人认为不必为一个特殊的超文本系统保留一个专门的术语。多媒体超文本也是超文本。因此,目前这两个术语都在使用。超媒体的研究使得这种技术得到了进一步的发展,在概念上也会进一步地拓宽。以上仅仅是超文本和超媒体的初步概念。
§8.1.3 超文本的发展历史及现状
1.发展历史
超文本从思想的诞生到技术上的实现及发展,经历了几十年的时间。其中值得一提的有几个事件:
(1)1945年,美国著名科学家Vinnevar Bush提出非线性方式组织正文的方法。Bush提出了一种叫做Memex的机器。Memex包含有一个庞大的文档库,Bush的原始思想就是把广为散布的信息聚集在一起形成一本新书。任何人都可以根据自己的意愿在其中的信息之间建立联系,形成某个特定的浏览路径。但是,由于40年代硬件条件的限制,Bush的想法没能变为现实。
(2)1963年,斯坦福研究所的Engelbert在Memex思想的影响下进行研究,于1968年产生了一个叫NLS(ON Line System)的Hypertext系统。NLS由文件组成,文件又由少于3000个词的段落组成,它们之间可以按层次结构或非层次结构链接。(www.xing528.com)
(3)1964年,Ted Nelson为这种技术杜撰了“Hypertext”这个词汇。Ted Nelson所参加的课题Xanadu开始于1960年。Xanadu的目的是把世界范围的文学著作放进计算机,并且用超文本技术链接它们,使它们易于使用。1988年一个大软件公司接手了这个课题,想把它商品化。
(4)1987年11月,在美国北卡罗莱纳州召开了第一届国际超文本学术交流会。
2.国际动向
继1987年在美国举行的Hypertext研讨会之后,自1989年起,每年交替在美国和欧洲召开一次国际超文本学术交流会。HYPERTEXT’93于1993年11月在美国华盛顿州西雅图举行。届时除宣读一些涉及理论、经验和软件实施的论文外,还有专题讨论、技术、方法和应用等方面的课程以及厂商的产品演示。除每年的学术会议出版论文集外,欧美一些国家还出版许多有关超文本的书籍及杂志,如英国的期刑“Hypermedia”,美国的“Hyperlink Magazine”等等。
当前,美国一些学者正在致力于Hypertext标准的研究并成立了相应的学术组织,以便进行标准化研究方面的交流。
(1)研究系统
①Intermedia是美国布朗大学于1987年为研究及教学开发的系统。布朗大学研究Hypertext已有20多年的历史。他们的第一个系统是1968年开发的,叫Hypertext编辑系统,用干产生有关阿波罗空间程序的文档。
Intermedia是在4.2BSDUNIX下开发的,可以在IBMRT、PC和Sun工作站上运行,最新版本也可以在Machintosh Ⅱ上运行。它由正文编辑器、图形编辑器、扫描图像浏览和三维对象浏览系统等几部分组成。Intermedia基本上只限于在布朗大学内使用。
②NoteCards是美国智能系统实验室于1987年开发的超文本系统。NoteCards有良好的浏览工具,包括一个组织复杂的NoteCards网络的层次结构系统。
基本的NoteCards结构是一个语义网。语义网由一组NoteCrads组成,NoteCards之间由类型链连接。NoteCards提供了一组工具以组织、显示和管理语义网,还提供了建立管理语义网程序的方法和协议。NoteCards的四个基本实体为卡片、链、浏览器和文件盒。
(2)商用系统
①Gudie是第一个用于Machintosh的超文本系统。Guide是一个建立电子文档的工具。它比NoteCards更面向正文。
Guide使用了四种链接类型:替换、注释、参考和查询。Guide最初是在Unix环境下开发的,后来移植到Machintosh。
②HyperCard是Apple公司1987年在Machintosh上开发的。它是应用最广的超文本系统之一。其最重要的原因就是Apple公司随机奉送Hypercard。
Hypercard的节点是与屏幕一样大的卡片。它提供有一些画图工具,这样,就很容易设计包含有复杂图形的正文的卡片。Hypercard还包括HyperTalk语言。在Hyper Card的卡片上,用户可以设计命令按钮。这些命令按钮就是HyperCard的链。
HyperCard提供五个级别的功能:浏览、输入、绘图、写作和编写命令文件。这样,不同的用户可以为不同的目的使用Hyper Card。
③KMS(Knowledge Management System知识管理系统)其前身是ZOG。ZOG是美国1972~1985年开发的用于结构式浏览的Hypertext系统。曾于1982年作为计算机辅助信息管理系统安装在一艘原子能航空母舰USA Carl Vinsen上。它的应用系统包括一个联机的策略手册和一个联机的维护手册。
ZOG的商业版KMS是由知识系统公司开发的。ZOG和KMS的节点叫框架。框架只有两种尺寸:全屏幕和1/2屏幕。框架内容可以是正文、图形和图像。
ZOG和KMS的结构非常简单,与HyperCard一样,只有一种节点,它的长处在于浏览速度快。
KMS的应用范围很广,可以用于电子排版、联机技术手册、项目管理、问题分析、ES用户接口、软件工程、计算机辅助外语翻译等等。
3.国内发展情况
国内了解和运用超文本思想的大学、研究所在逐步增加,有些单位正在研究自己的超文本系统。国内已推出的超文本系统,一个是国防科技大学在PS/2DOS下实现的“多媒体超文本编辑、表现及管理系统HWS”,另一个是广西计算中心的“基于图形的联想多媒体GBH”。该软件是Sun工作站的多窗口环境下实施,用图形形象、直观地描述各种关系,独具特色。它和上面介绍的世界上的典型系统相比各有所长。GBH可广泛应用于许多行业。现在应用于办公系统、学习系统、资源信息管理和昆虫信息及分类管理。
4.典型的超文本系统简介
现就目前几个比较成功的超文本系统介绍如下:
(1)KMS——管理知识分布式多媒体系统
KMS是一个在典型的多媒体系统,它的核心是它的概念数据模型。一个KMS数据库由屏幕大小的WYSIWYG(What You See Is What You Get)活动空间构成。这种工作空间称为框架,它可以包含正文、图形和图像数据。每个数据项能链接到其它框架或者用来生成程序。
数据库通过基于若干文件服务器分布访问,如果磁盘空间允许,数据库可足够大。KMS应用非常广泛,可用于管理、生产支持、文件生成、产品设计和软件工程等领域。
(2)NoteCard——通用的超媒体环境
NoteCard是一个从实验室走向广泛应用的通用的超媒体环境。该系统提供用户一个电子卡片网络,这些卡片通过链相连接。作为一种媒介,通过它用户可以表示相关信息的集合;作为一种数据结构,通过它可以组织、存储、恢复信息。系统可提供显示、修改、处理和通过网络操纵功能。
NoteCard应用于Xerox Lisp程序设计环境,它能够帮助作者、研究员、设计人员和其他一些脑力劳动者从事分析信息、构建模型、推理、设计产品和处理信息等。
(3)HAM——通用的超文本编辑器
HAM是针对超文本存储系统的一个通用的基于转换的多用户服务器。HAM也是一个低级的存储服务器,它提供一个通用的适性很强的模型,这个模型可用于许多不同的超文本系统。
HAM用图或数据库存储它所管理的全部信息,图存储于一个中心区域,能够在分布环境下访问。典型地,HAM通过一个字节流协议与系统进行通讯。
此外,还有Intermedia、Document Examiner、Neptune和WE等一些系统陆续投入实际运行。
超文本技术在存储、查询、浏览信息和知识表达方面相当灵活,它的思想更符合人的思维和习惯。用户使用超文本系统会感到非常自由,所以,近几年受到各国计算机界的广泛关注。
5.应用前景
从目前的发展情况看,超文本技术有很广阔的应用前景。
对计算机专业人员来讲,可以将超文本技术分别与数据库管理、软件工程、人工智能、面向对象方法等结合起来,开发出更灵活、功能更强的软件工具和环境,应用于不同领域。
非专业人员则可以根据需要选择超文本系统,将其用于教学、百科全书、电子博物馆、旅游指南、修理业、制造业、广告业、办公系统等等。
超文本技术的出现与应用,无疑对信息处理产生了很积极的影响。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。