莫顿·韦格曼
1.知识表征的本质
进化为现存的有机体提供了自然智能保存、发展和利用所必需的遗传和神经结构。为了创造像自然智能那样的、能处理世界上的事态的人工智能,就必须找到表征这些事态的方法。因此知识的表征是人工智能的基本条件。
戴维斯、施罗伯和索洛维茨(1993)对知识表征的本质作了有说服力的分析。在下一节中,将对他们的分析作出描述,然后提出简要的评论。
2.知识表征的概念
2.1五个方面
戴维斯、施罗伯和索洛维茨在下述简要的说明中把知识表征区分为五个方面。
即使知识表征在AI中是一个中心的、在某种意义上是最熟悉的概念,但关于它的最根本的问题——它是什么?——则几乎看不到直接的回答。大量的论文已对表征的一种或另一种变体作了阐发,而另一些论文则对表征所应有的各种属性作了论证,还有一些论文强调的是对一般表征概念至关重要的属性。
在本文中,我们将返朴归真,开门见山地处理问题。我们相信,答案能基于表征所起的五个重要的、彼此有别的作用而最好地得到理解,其中每一个作用都对表征所应有的属性提出了不同的、甚至时常有冲突的要求。我们要论证的是:记住这五个作用将展现这样一幅有利的、广阔的前景,它会为某些长期聚讼纷纭的争论带来解决的希望,并使该领域的探讨和实践充满活力。
什么是知识表征呢?我们认为:该概念最好根据它所起的五种不同作用而加以理解,其中每一个对目前的任务都至关重要:
第一,知识表征从根本上说是一种替代物,一种关于事物本身的代表,它常常通过思维而不是行动,即通过对世界的推论而不是采取对它的行动而让实际存在物决定结论。
第二,它是一组本体论承诺,即是说是对于下述问题的一种回答:我们用什么术语思维世界?
第三,它是一种关于由下述三种成分表达的理智推论的零碎的理论:(1)关于理智推理的表征的基本概念,(2)表征所支持的推理集合,(3)表征所推荐的推理集合。
第四,它是有实用效果的计算的媒介,即是说是思维得以完成的计算环境。对这种实用效果所作的一个贡献是由表征为着组织信息以促进作出被推荐的推理而提供的向导所奉献的。
第五,它是人类表达式的媒介,即是说是我们用以谈论世界上的事物的一种语言。
理解其作用,承认其多样性,有几个有用的步骤。其一,每一作用都离不开与一表征略微有别的某东西;因而每一作用都导致一种有趣的、不同的、我们想让表征拥有的属性之集合。
其二,我们相信:那些作用提供了一种构架(framework),它对描述各种各样的表征是有用的。我们设想:表征的根本心智定势可以通过理解它怎样估价每一种作用而加以把握,而且,这样做可揭示基本的相似性和差异性。
其三,我们相信:当五种作用被恰如其分地加以考虑时,那么先前关于表征的某些分歧看法就会迎刃而解。我们可通过重新虑察、解剖关于构架和逻辑的早期论证来证明这一点。
最后,我们相信:以这种方法看待表征,对于研究和实践都很重要。对于研究来说,该观点对该领域中的具有根本重要性的问题提供了直接的回答。它还为思考表征中什么重要这一问题拓展了视野,并断言表征研究的一个重要方面——把握和表达自然世界的丰富性——所受到的注意远远不够。我们相信:这一观点也能改进实践,如让实验家想到灵感,而这正是各种表征的力量的重要源泉。(戴维斯、施罗伯和索洛维茨,1993,pp.17-18)
2.2替代方面
一个有理智的系统一定具有知识,而知识又一定适于被编码。被编码的知识就是表征。戴维斯、施罗伯和索洛维茨以下述术语讨论了知识表征的替代本质。
作用之一:知识表征是一种替代物。任何有智能的、想推论其世界的实在都会面临一个重要的、不可回避的事实:推论是一个内在地进行的过程,而它想推论的大多数事物则只存在于外部。例如,一从事策划自行车装配的程序(或人)就不得不推论这样一些实在,诸如轮子、环、手柄和链轮,而这些事物只存在于外部世界。
这种不可避免的二分法就是表征的一种根本的原理和作用:它在推理器内部作为替代物,作为存在于世界中的事物的代表而起作用。对表征以及用表征所进行的运算代表着对真实事物的运算,即是说代表着与世界的直接相互作用。根据此观点,当我们不能或还没有想到在世界中采取那种行动时,推理本身部分就成了那种行动的替代物。
把表征当作替代物自然会导致两个重要的问题。第一就是它所意指的同一性:它是一个关于什么的替代物?在替代物与它在世界中意想的所指之间一定有某种被指定了的符合形式;符合就是关于表征的语义学。
第二个问题是逼真度:替代物怎样接近于真实的事物?它把握到了、进而详述了本原的什么属性?它略去了哪些?一般来说,完全的逼真度在实践上和原则上都是不可能的。之所以说原则上不可能,是因为事物自身之外的任何事物都必然不同于事物自身(不说别的,仅就位置来说是如此)。换言之,对象的唯一完全准确的表征就是对象自身。所有别的表征都不准确;它们不可避免地包含有简化的假定,可能还有人为的东西。
两种简要的阐释就会扩展这种关于表征即替代物的观点。第一,它似乎一无例外地适用于齿轮之类的可触的对象和不可触的对象:表征可作为行动、过程、信念、因果性和范畴之类的抽象概念的替代物而起作用,允许它们在实在内被描述,因而它能对它们作出推理。第二,形式对象自然能以完全的逼真度存在于机器内部:例如数学实在就能确切地、明确地被把握,因为它们是形式对象。由于几乎是全部推理任务都会碰到这样的需要,即处理自然对象(即是说,在真实世界中碰到的那些东西)以及形式对象,因此不完全的替代物在实用中就是不可避免的。
从不完全替代物的不可避免性中可引出两个重要结论。其一是,在描述自然世界时,我们一定免不了撒谎,至少是通过省略。在最低限度上,我们一定省略了自然世界的无限复杂性中的某些方面;此外,我们的某些描述可能引入了并不存在于世界中的人工造物。
第二个也是更重要的结论就是:所有关于自然世界的、有足够广泛基础的推理最终一定会到达这样的结论,即不正确的、独立于所用推理过程和所用表征的结论。完善的推理也不能拯救我们:如果世界模型不知什么缘故有问题(且必然如此),那么某些结论就会不正确,不管它是怎样被仔细抽绎出来的。更好的表征也救不了我们:所有的表征都是不完善的,而任何不完善性都能成为错误的源泉。
错误的意义自然是可变的;而且,选择一个好的表征的技艺主要就在于:为了眼前特定的任务找到一种可把错误减少到最低限度(甚或排除)的方法。但是替代物的不可避免的不完善性意味着,我们至少能为以任何方式推论自然世界的任何实在提供一种保证:如果它的推理很长、很广泛,那么它就肯定出差错。
因此,哪怕是只作出可靠的结论也免不了使推理犯错误;它能肯定的是:推理并非错误之源。假如有广泛基础的推理不可避免出错,那么从可靠的推理转向别的推理模式因而就不是从完全的准确性过渡到错误,而是一个使错误的更多的源泉的可能性与它可能提供的利益(例如有效性)实现平衡的问题。
我们不是说:不可靠的推理应当随便予以接受,而是主张:假如错误不可避免,甚至可靠的推理也不例外,那么从效用方面估价运用可靠和不可靠推理方法所伴随的相关的代价与利益就是很有意义的。(戴维斯、施罗伯和索洛维茨,1993,pp.18-19)
2.3本体论方面
对实在的表征不只一种方法。不过,可以肯定,在凸现某些特征时,特定表征的选择就会把实在的其余特征放在次要位置。戴维斯等人用下述术语讨论了这个本体论承诺或结论。
2.3.1作用之二:知识表征是一组本体论承诺。像我们所论证的那样,如果所有表征都是不完全地近似于实在,每种近似既注意到了某些东西,又忽略了别的东西,那么在选择任何表征时,我们必定是以同一的行动方式对于下述问题作出一组决定,即在世界中怎样看,看到了什么。即是说,选择表征意味着作出一组本体论承诺。
聚焦作用是表征所提供的东西中的必要部分,因为自然世界的复杂性是不可抗拒的。在决定关注世界上的什么、舍弃什么时,我们(以及我们的推理机器)需要向导。
试图为不同任务领域建立精致本体论的工作有一漫长的历史,包括早期关于液体的本体论工作(海斯,1978),广泛用于表征电流回路的集总元件模型(例如,戴维斯与施罗伯,1983)以及关于时间信念甚至程序本身的本体论。这些本体论的每一个都提供了观察世界某一部分的一种方法。
这些本体论自然是用各种不同的语言和概念(如逻辑、表处理语言)写出来的;其基本信息不是这种语言的形式而是内容,即是作为思维世界的方法而提供出来的概念集合。
我们通过选择一种或另一种本体论而作出的承诺对于目前的任务可能产生相当不同的观点……。基于规则(如Myccnn[2])所考虑的(医学的)诊断从根本上不同于基于构架(如Internist[3])所考虑的同样的诊断。在这里,Mycin把医药世界当作是由连接症状与疾病的经验联系所构成的,而Internist看到的是典型症状,在特定的、典型的疾病中,它们应匹配于眼前的案例。
2.3.2承诺开始于最初的选择。上述Internist例子还表明,即使是在众所周知的表征技术的层面,也存在着重要的、不可回避的本体论承诺。逻辑、规则、构架等包含着关于各种对世界至关重要的事物的观点。例如,逻辑就包含了这样的(相当微妙的)承诺,即根据个体的实在及其相互关系去看待世界。基于规则的系统便根据属性-对象-价值的三合一以及把它们联系起来的似乎合理的推理规则来观察世界,而构架让我们根据典型的对象进行思维。
这一来,这些表征技术的每一个对于值得引起注意的东西都提出了自己的观点,反过来,每一个又设想:任何难以用这些术语观察的东西都可以置之不理。自然,这种主张并无正确的保障,因为任何被忽略的东西后来有可能证明是有关系的。但是这一工作原则上是没有前途的——每一表征都有对世界的某物的忽略;因此我们能做的最好是从好的猜想出发。现存的表征技术对于什么应予注意、什么应置之不理提供了一系列的猜想。因此对它们作出选择就涉及到一定程度的本体论承诺:这种选择对我们关于那个任务的知觉与探讨以及对我们关于被模拟的世界的知觉都有重要的影响。
2.3.3承诺之分层累积。于是,表征的本体论承诺就从表征技术的层面开始,并由此而累积。随着我们对技术的运用,承诺的随后的层次便得以形成。试以In ternist中似构架的结构之运用为例。在最基本的层次,根据构架来看待诊断的决策就提醒人们依据典型症状、欠缺和分类学上的等级来进行思考。但是典型症状是属于什么的,分类学应怎样组织呢?
对该系统的较早的描述(波朴尔,1982)说明了这些问题在目前的任务中应怎样予以回答,并提供了第二级承诺:
存在于Internist系统中的知识基础是由两种基本的元素构成的,即疾病事实和表现……(它)还包含了一个……疾病范畴的等级,最初是围绕着器官系统的概念而组织的,在其最高层次,就有“肝病”“、肾病”等等之类的范畴。(pp.136-137)
因此,典型症状旨在把握典型的疾病(例如一种疾病的经典的案例),它们将在以组织器官为线索的分类学中得到组合。这组选择是可感的、直观的,但很显然,它不是把构架应用于那个任务的唯一的方法。因此,它是本体论承诺的另一层级。
在第三(在此案例中,是最后的)层级上,这组选择例示了:哪些疾病被包括在内,它们会出现在该等级系统的哪些分支中?出现在这个层面上的本体论问题可能是根本性的。
对于所有表征技术,必须作出相同类型的决策,因为它们的每一个对于怎样观察世界只提供了一个初级的猜想:它们提供了一种观察方法,而并未指明怎样例示这种观点。构架显示典型症状和分类学,但并未告诉我们:哪些事物应选作典型症状,规则提示的是用合理推理来思维,但并未告诉我们:哪些合理的推理会出现。同样,逻辑能教我们依据个体和关系去观察世界,而没有具体说明所用的是哪些个体与关系。因此,对一种特定世界观的承诺是从选择表征技术开始的,并随着随后的关于怎样用这些术语观察世界的选择之作出而得到累积。(戴维斯、施罗伯和索洛维茨,1993,p p.19-21)
2.4推理的方面
智能推理系统的设计者选择了反映基础性的推理理论的知识表征样式。源于逻辑科学的理论主张,知识表征是作为逻辑符号而投射的,而由神经科学激发的理论则举荐表现为节点和链路网络形式的知识表征。
2.4.1作用之三:知识表征是一种关于智能推理的零碎的理论。知识表征的第三个作用就是作为关于智能推理的一种零碎的理论。这种作用之出现,是因为表征的原始概念一般是由指导人们怎样理智地推论的洞见或某种关于理智的推理意味着什么的信念所激发的。
该理论在两种不同的意义上是零碎的,(1)典型地说,表征只吸收了驱使它的洞见或信念部分,(2)这种洞见或信念反过来又只是智能推理的复杂的、多面性的现象的一部分。
2.4.2什么是智能推理?什么是智能推理的必要的、限定性的属性?作为关于智能推理本质的一个学科、一种观点,人工智能相对年轻的一个结果就是常常借鉴别的领域的工作。五个领域——数理逻辑、心理学、生物学、统计学和经济学——为相互有别的关于什么东西构成了智能推理的五个概念提供了启发(表1)。
表1 关于智能推理和它们的理智渊源的观点
几个有用的结论来自于下述理解,即对每种传统视之为根本问题的不同观点的理解。首先它证明:对这些传统的任何现代产物——即上述图表下面所表明的任何表征技术——的选择意味着只是选择表征。以同样的方式,我们正在对关于智能推理的基本本质的概念作选择。
第二,这些概念在一些重要方面彼此有别,即在关于我们试图把握的现象概念中存在着根本的差异。进而不同的概念又意味着:在努力创造智能程序的各种探索活动的特征和目的方面,存在着根深蒂固的差异。简言之,关于智能推理的本质的不同概念导致了不同的目的、不同的成功定义和不同的人工造物。
最后,这些差别几乎没有被明确表达出来。而缺乏明确表达进而又导致了这样的论证,即当我们相信,真正的结果是关于智能的根本本质的不同概念时,这些论证可以根据表征选择(如用初级谓词演算进行的可靠推理与因基于构架系统而产生的难以描述的推理)之类的结果而陈述。理解不同的观点有助于对那些结果作出适当的分析和分类。(戴维斯、施罗伯和索洛维茨,1993,pp.21-24)
2.5计算方面
就把推理当作计算而言,特定知识表征的组织属性就可能导致最大的计算有效性。
作用之四:知识表征是有效计算的媒介。从纯机械论观点来看,机器中(也许在人内部)的推理是一种计算过程。简言之,我们使用一个表征,一定是以之进行计算。因此,关于计算有效性的问题必然是表征概念的核心。
这一事实早就为人们认识到了,至少毫无疑义地为表征设计者认识到了:与他们对一组被推荐的推理的详述一道,表征常常为怎样以促进这些推理形成的方式组织信息提供了一系列的观念。例如原构架概念的一个必要的部分就是关于这类方法的,就像许多关于构架的论文所阐明的那样(明斯基,1974,1975):
一构架……(表征)一遥远的位置,如处在某起居室中,或来到一小孩的生日舞会上。
隶属于每一构架的是多种信息。该信息的一些是关于怎样使用那构架的。一些是关于人们预期下一步要发生的东西的。
一些是关于那期盼没实现时该怎么办的。
在那些构架中,关于触发器和程序上的附件的概念并不是关于程序写了什么陈述(在这里,该理论是相当模糊的)。因为它是一种对于怎样组织信息的有用方法的描述,如(把前面引文加以阐释)让关于怎样用那个构造、预期未实现时该做什么的信息隶属于每一构架。同样,将那构架加以组织使之进入分类学等级系统,既启发了分类学的推理,又促进了它的实施(就像在结构遗传网络中那样)。
别的表征也提供了相同的向导。传统的语义学网状系统通过提供一系列适当的链这样简单的权宜之计来推进双向传播,而基于规则的系统则通过提供从目的到其结论与之相符的规则(回向连链)和从事实到其大前提与之相符的规则(上向连链)的索引,而推进合理的推理。(戴维斯、施罗伯和索洛维茨,1993,pp.26-27)。
2.6通信方面
知识表征的最终目的就是使与计算机世界的信息沟通以及与人的世界的信息沟通成为可能。而使这些通信得以进行的知识表征语言则应受到优先的关注。
作用之五:知识表征是人类表达式的媒介。最后,知识表征也是我们由以表述世界上的事物的手段,它们还是表达式和通信的媒介,我们正是通过它,把世界上的事件告诉给机器(也许是相互的)。只要我们需要向机器谈论世界,只要我们是通过创造和传递表征而予以实现的,那么表征的这个作用就是不可避免的。因而知识表征的第五个作用就是对我们有用的、作为表达式和通信的媒介。
反过来,这种作用又提出了两类重要问题。一是众所周知的:表征怎样恰到好处地作为表达式的媒介而发挥功能作用?它一般是怎样的?明确到什么程度?它提供的表达式充分吗?等等。
平常很少被讨论的一个重要问题就是:它作为通信的媒介怎样恰到好处地起作用?即是说,我们以这种语言谈论和思维容易到什么程度?什么样的事物用这种语言谈论容易一些,什么样的事物难些以致实际上不可能?
请注意这些问题所涉及的形式:它是多么容易?而不是我们能行吗?这种语言是我们必须使用的语言;因此原则上可能的东西就是有用的,但不是足够的;真正的问题是具有实用主义功利性的问题。如果表征使事物可能,而不是使之容易,那么作为真正的使用者,我们大概就绝不会知道:怎样运用它,或者说它是不是真的不能表述我们想说的某些事情。表征就是我们以之进行沟通的语言;因此,我们不用太大的努力就一定能够讲说它(戴维斯、施罗伯和索洛维茨,1993,p.27)。
2.7评论
知识表征概念由替代物、本体论、推理、计算和通信五方面构成。这些方面是按哲学方面(替代物、本体论)、心理学方面(关于智能推理的理论)和实践方面(计算效能、通信促发性)的顺序排列的。在设计计算机程序的不同时期,不同的方面会受到不同的重视。对研究和发展的强调可能要求回到知识表征的哲学和心理学方面,并由此而证明它们对于创造性事业的价值。
3.表征与智能
3.1数学与表征
科学知识常以数学等式的形式被表征。而等式是关于物理世界的事件的符号表征。因为物理科学是用符号数学表征的,因此认知科学包括人、动物和人工智能,为了其发展也要求建构符号数学表征。自然系统和人工系统的认知性数学代码使智能得以适应于环境。
3.2关于表征和智能的一般理论
智能系统如人或动物或人工系统的行为是表征系统的功能。这个理论性命题可用符号加以表达:B=f(R)。符号表达式(f R)意思是:一运算组合是用表征系统完成的。范例有数学表征系统(例如,不同等式的集合)、逻辑表征系统(谓词演算、乘方运算的INRC群)、电磁表征系统(如电子回路图)和人工智能表征系统(程序语言、语义学网络、树状图解、组合及相互套入范畴、构架、文稿编辑程序)。
在下一节,加利斯特(1990b)提出了关于动物(包括人类)认知的理论,布鲁克斯(1991)阐发了他关于可动机器人的理论。前者的观点与用符号表示的理论——B=f(R)——是一致的,并包含于其中。而后者的立场则是对立的,因为他主张,他的可动机器人没有表征系统但可表现出智能行为。他关于“无表征的智能”的观点与他的智能可动机器人依赖于有穷状态机似乎是有冲突的,因为有穷状态机既离不开程序语言,又离不开电子的声纳的和光学的电路图。
3.3表征与动物智能
3.3.1一般理论。加利斯特对动物认知中的数学表征本质提出了一种形式理论。心理学中的表征概念的意义以及它的形式特征在下面得到了阐述。
关于表征的概念,它们是什么,它们是否存在以及一个表征概念在动物和人类行为中应起什么作用,这些都是有争议的课题。我曾作过这样的论证(加利斯特,1989,1990a):表征在心理学中应有同一的意义,就像它在数学中那样,在那里,它意指系统之间的起作用的同型性。两系统间的同型性(形式上的一致)使在一系统中利用运算作出关于另一系统的结论成为可能,就像代数的运算被用来作出解析几何学中的几何学结论那样。
如此类推,心理学中的表征就是大脑或心灵内的加工(依赖于分析水平)与这些加工使动物行为所适应的环境方面之间的起作用的同型性。更形式化地说,表征存在,如果:
(1)存在着从外部实在或事件(短暂的间隔、众多的集合、食物出现率、模型的形状、食物的化学特征、猴群内母系家族的数量等)到用作这些实在之代表的心理或神经变项的映射。
(2)在涉及到这些神经或心理变项的关系的、组合的运算与涉及到它们所表示的事物的关系及组合加工之间,存在着一种形式上的一致。例如,大脑对表示两个不同的被观察到的食物出现率的神经信号的加工与在那两个加工组成的世界中的运算之间的一致。如果两种加工同时运算时,食物出现率是每一孤立运算过程所产生的比率的总和,如果大脑在计算同时发生的运算所期望的比率时附带地把两种表征信号的比率结合起来了,那么在同时起作用的过程(被表征系统中的组合过程)与对神经系统内的有关变项的附带组合(表征系统内的组合过程)之间就存在一种形式上的一致。
(3)映射过程与组合过程十分协调,以至于表征系统中的组合过程就产生关于被表征系统中的事件与关系的有效的预期。大脑组件中的运算结果可预言或预期外在于那组件的系统中的过程与关系的结果或状态。
(4)神经的或心理的运算一般地产生关于外部事件及关系的正确预言的能力可由产生适应于这些事件和关系的行为的机制来说明。换言之,心灵或大脑过程与世界过程的形式一致,有利于生物学目的。(加利斯特1990b,pp.1-2)
在下面,加利斯特把他关于表征的形式理论与关于心理测量的理论关联起来了。
测量理论最初由史蒂文斯(1946)所阐发,稍近又得到克兰茨、卢斯、萨普斯和特夫斯基(1971)等的发展,知道这一理论的人将认识到表征之运用与测量理论之运用之间的相似,在这里,根本的任务就是为被测量的心理变量(如高声)与那个数域的某些或全部之间存在的同型性建立必要的、充分的经验条件。同型性依赖于找到适当的测量步骤(标准),它从心理变量映射到它的数量代表,此外,同型性还依赖于对心理变量的(如对“音高于”的判断)组合运算与“>”“、+”“、=”之类的数量运算之间所存在的形式上的一致。这种一致允许人们根据对心理变量适当地被决定的数量表示式的数学运算,作出关于心理变量的有效推论。
表征具有不同程度的丰富性和力量,就像测量的标准所是的那样,这一点是表征的定义所固有的。表征的丰富性或力量是由可用来作出关于被表征系统的结论的各种组合运算所决定的。在极端贫乏的表征如名义上的标准中,有效地被用到的只有一种运算。就名义的标准而言,这就是恒等算子(=)。当人们用到一个名义的标准(如关于运动衫的号码)时,被表征的实在(运动员)就是同一的,当且仅当他们有相同的代表(相同的号码)。在更有力量的表征中,就可用到相互关联的组合运算。如果人们得到了关于某些心理变量的比率刻度表征,如被知觉到的重量,那么所有数域都可能被用到(→,+,*),以便作出关于被从数量上表征的变量的结论,就像一个人得出结论说:一定的重量被感觉到是另外两个重量合在一起的重量的两倍以上。
表征系统中的组合运算用不着同型于对那个数域的算术运算。例如组合运算可用之于树状结构或相互交叉的范畴,而不是用之于数量。(加利斯特,1990b,pp.2-3)
在下面,加利斯特在表征与表示式(rePresen tive)之间作出了区分。
在表征与表示式之间作出区分是很重要的。一个表示式就是表征系统中的一个符号,它表示的是实在或变量的值或被表征的系统中的变量之关系。当存在着从世界变量到心理或神经变量的稳定的映射时,心理或神经变量便存在着。粗略地说,研究感觉过程就是研究低级的物理变量向它们的低层次的心理物理或神经表示式的映射——例如研究从光谱组合到换能器通道中的活动(心理物理的分析层次)或到锥体活动(神经层次)的映射。对知觉的研究就是研究,高级刺激变量——如对象形状——如何映射到高层次心理或神经表示式,例如到思维的皮层领域中为形状编码的活动中心。
神经表示式之存在并未确立神经表征之存在。例如表明某皮层区域的活动以有序的、具有多样集合的方式变化并不能肯定:大脑表征了那种多样性。表征是系统间的一种关系,而不是变量之间的关系。被表征系统和表征系统都是由变量及其关系以及涉及到变量的加工或运算所构成的。表征要存在,环境变量的神经或者心理表示式就必须进入能产生关于被表征的变量的有效推理的组合性的神经或心理加工之中。
形成关于心理或神经表征的概念取决于从世界变量到心理或神经变量的映射之出现,取决于在两个可能极受限制的领域的运算之间的形式上的一致。这意思是说:该概念不适用于,至少不严格地适用于这样的情况,在那里,人们对被认为是从心理学上被表征的实在方面不可能给予适当的形式化描述。例如,对光谱合成——颜色视觉中的物理变量——不可能有符合于我们对色彩知觉(光环)的形式描述的描述。被知觉的色彩之间的关系在产生它们的刺激中找不到配对物。条件等色[4]配对物是产生同一的心理表示式的不同光谱合成的光。条件等色配对物无处不在;彩色电视机和彩色打印机依赖于它们,因为这些媒体绝不能再生那表层所呈现的相应的光谱;它们习以为常地“戏弄眼睛”。因此即令是同一的算子也不能有效地应用于我们的色彩知觉。颜色在心灵中,而不在世界中,反过来说,存在于世界中的光谱合成是不能在心灵中被表征的。
不过,我想论证说:表征的数学定义从概念上说是有用的,即使被用于下述许多领域也是如此,在那里我们不能从形成上描述:它关涉到我们相信其为某种心灵模式所把握的世界的什么。对心理模式(心理学理论)的详细阐述,对被摹拟的东西的形式描述是相辅相成的事情,这对任何人都是显而易见的,只要他承认语言学的句法理论——对语言结构的形式化描述——与心理学中的语言产生和理解理论之间有相互作用(加利斯特,1990b,pp.3-4)。
3.3.2时间间隔。在下面,加利斯特把表征理论应用于时间间隔,并把表征与由吉本和丘奇(1981)所做的关于动物行为的实验工作联系起来了。
人们怎样用下述理论说明动物的时间分辨,这是很难弄清楚的,根据该理论,动物的神经系统没有变量,它们的神经系统的值以一种系统的方式相关于被经历的时间间隔的持续。因而关于动物的时间分辨的材料是从时间间隔到它们的心理和神经表征的映射的证据。更重要的是,吉本和丘奇对于计时行为中的决策过程的细致的理论与实验关注已提供了令人信服的根据,因为它用行为资料证明:普通实验室中的鸟和哺乳动物在这里所辩护的意义上有关于时间间隔的表征。为了对世界的当下状态作出有效的推理,它们用关于时间间隔的表示式完成了同型于减法、划分、比较(→)的运算。
例如,在布鲁纳所做的、为吉本和丘奇在论文中所考察的实验中,同他们的前几个实验一样(例如吉本和丘奇,1981),实验材料适合于一种模式,在那模式中,决策过程计算出了正消逝的间隔与被记起的标准之间的差异,并通过那个标准的评估,区分了这一差异,还对商是否超过了决策临界值作出了检验。符合这种决策规则的模式说明了这些材料及别的材料具有相当的明晰性,而别的模式则望尘莫及。除非某人对这样的实验发现提供同样成功的说明,这些实验不涉及到对作为时间间隔的变量的减去、划分和比较,否则这些发现就是证明动物具有数学意义上的时间间隔表征的根据。用于心理学变量的心理学运算系统是同型于时间系统的。(加利斯特,1990b,pp.5-6)
3.3.3认知映射。昆虫及别的动物要想准确地对准能提供食物的目标,掌握关于环境的航行几何学是必不可少的。关于这种航行几何学的本质,它的形式表征以及认知映射的存在、形式和功能,将在下面予以讨论。
几何学是对空间关系的形式描述。对被表征系统的这种形式描述之存在使直接应用这里所辩护的空间表征定义成为可能。说一昆虫表征了它的环境的空间结构或环境的某些方面就等于说存在着从这种结构要素到昆虫神经系统中的有关表示式的映射,就等于说昆虫的神经系统完成了对于这些表示式的运算,而这些运算同型于对它们所表征的空间构造的运算。蜜蜂毫无困难地学会了分辨两维模型这一事实似乎包含了这样的映射,即从这些模型到神经系统中的表示式的映射,并且至少利用了恒等算子。
动物是否有关于它的认知环境的映射这一问题也能在几何学框架内重新加以阐释(程,1986;程与加利斯特,1984)。许多昆虫与别的许多动物一样,能借助被记住的、目标与周围界标之间的几何关系而找到目标(有关评论可参阅加利斯特,1990a)。问题是,被表征的是什么样的几何关系,为了从最初的(直接被编码的)关系推论出别的关系,可能作出什么样的运算?
映射表征的是环境的外观。像通常所理解的那样,外观是由构成环境的面的相对测量位置而得到界定的。相对测量位置决定了由面所形成的角以及面的距离,面与面之间的距离,反之亦然。因此提出动物是否有映射这一问题的一种方法就是问:它是否表征了目标与周围界标之间的测量关系。如果它不是这样,那么它就没有表征环境的通常意义上的外观。不过,卡特赖特与科利特(1983)表明:蜜蜂记录了靠近食物源的界标的罗盘方位(一种角的关系),而程等人(1987)则说明:如果界标离食物源有不同距离,但有相同的外观与明显的大小,那么蜜蜂更依赖于附近的界标,这也意味着它们也记录了在界标与食物源之间的距离。简言之,蜜蜂记录了目标与周围界标之间的测量关系,如果它们有关于环境和那环境内位置的映射,那么这就是它们必须做的事情。(加利斯特,1990b,pp.9-10)。
计算从食物源到目标间的距离可以借助视差这样一种天文学家所熟悉的、也许内在于昆虫和别的动物的认知能力中的方法来完成。
界标离食物源的距离可以借视差加以估算,即根据对蜜蜂的特定的横向位移的视角之变化而加以估算(卡特赖特和科利特,1979)。视差在估算距离时的重要性可以解释蜜蜂或黄蜂在接近与离开食物源或巢穴时所采取的“之”字形飞行模式(维纳,1981)。“之”字形飞行模式在引起蝗虫扑向目标之前所作的针锋相对的注视活动中的作用可能是独一无二的(科利特,1978,华莱士,1959),在引起小沙鼠越过陷阱之前所作的垂直转动脑袋中的作用也是如此(埃拉德等,1984)。索贝尔(1989)利用人工诱导的视差变化说明:黄蜂减缓速度是它的跳前注视期间的目标视差运动的一种作用。把同一级别的减速与所跳的距离关联起来的千篇一律的功能作用常重新出现,以用来对准黄蜂在得到所需视差的注视期间横向运动所形成的距离。
依视差所作的距离估算在各种映射的建构中起着核心作用,因为在任何可动的、能检测其所通过的距离的动物中,这种机制适于对无论多大的距离作出量的测定。被估算的距离越大,借视差、以一定程度的准确性对之估算所需要的横向位移也就越大。映射的建构也就要求动物把距离和从不同的观察点所作出的角度估算结合起来。而要如此,运动的动物就必须记下它所经过路程的各点之间的测量关系。
有一基本的文献表明:从蚁到蝙蝠的各种动物计录它们当前的位置,利用的是航位推测法或路径整合,即是说,利用的是这样的神经运算,即它至少大致类似于相对于时间的速度整合(例如维纳等,1981)。航位推测法提供了对位移距离(或速度)的估算,这对远距离的视差估算是必不可少的,而且它还可以提供关于不同观察点的相对测量位置的信息,这是建构地心映射所必需的。加利斯特(1990a)指出:要形成地心测量映射,计算就必须把来自于推测模数的位置、航向信息与来自于知觉模数(就像用于根据视差计算距离的模数)的对象距离、角度的信息结合起来。
必须强调的是,卡特赖特与科利特(1983)以及程等(1987)的实验业已表明:蜜蜂可记录界标与到达它们的距离的罗盘方位,议对记录目标与由界标所规定的外观之间的欧几里德关系来说,是必不可少的材料。还要强调的是:航位推测过程提供了关于动物的位置与奔向不同有利地点之间的地心关系的必要信息。因而,实验上已证明:处于它们之间的蜜蜂知觉和航位推测系统提供了建构地心方面的欧几里德认知映射所必需的材料。(加利斯特,pp,10-14,着重号为我所加)
3.3.4范畴与概念。在下面,数学表征理论将应用于范畴或概念的定义之中。
在讨论范畴和概念时,清楚地记住从被表征实在到它的表示式的映射与对这些表示式的运算之间的区别是有裨益的。一种范畴就是关于大量可区分的、在某种背景中(对于某组运算来说)被视之为等值的实在的一种表示式。数字是范畴的典型的例示:数字3表征的是那些别的极为不同的、其大数是3的一切集合。只有在那些集合大数是相关变量的上下关系中,它才能用之于旨在作出关于这些集合的推理的运算中。定义范畴有两种极为不同的方法。一是给予规定(内涵定义)或列举(外延定义),它能确认那范畴的表示式有效地指称的一切事物。例如数学3能指称下述所有集合,它们可以与为着检验3这一目的而构想的抽象指称集合——对应地加以排列。这种定义3的方法强调的是,从大数到它们的表示式的映射过程。它说明的只是这些表示式在任何推理系统中所起的作用。另一定义范畴的方法就是详述它在一系统中所起的作用。3是直接后于2、先于4的整数,是一大于1的第一个质数,是头两个整数的总数,5与2之间的差等等。这种定义范畴(或概念)的方案并未述及这个表示式有效指示的东西是什么。算术的真理内在于算术的系统中,而不在该系统可以表征的范围内。当范畴以这种方式定义时,我们就更倾向于把它看作一个概念。(加利斯特,1990b,p.16)
在下面,将以鸽子为例对范畴之形成的研究作出概述,并给以数学的解释。
赫恩斯坦所考察的实验说明:当一鸽子被强化对某种自然类型如树等标本作出反应时,它就把那范畴的新奇标本视作强化的预兆,即使通过强化向它显示的只是某些树的照片,而不是鸽子在标本中可靠区分出来的别的东西。(因而树的照片并不像条件等色的色彩刺激,后者是同一的,因而是不可区分的心理表示式。)他作出的分析说明:条件作用发生在范畴水平而不是在个体标本水平,因为新的标本是在各种程度的任务的条件作用下被轻而易举地反应的,就像先前用来例示被强化范畴的标本一样。
鸽子似乎已经具有或易于形成关于这些自然类别的范畴。我们大概可以把范畴看作是在多维描述空间中的、由边界曲面所围成的体积。一个心理或神经描述空间就是其维度符合于描述对象的维度的空间。皮层似乎是由这样的空间构成的,因为不同皮层区的活动中心依照各种描述维度限定了刺激的价值。如果鸽子有关于某些或全部自然类别的天赋范畴,那么这些边界曲面就是先在的,鸽子在条件作用过程中所做的事情就是对强化预示器可靠地映射进来的体积作出分辨。换言之,鸽子可能具有内推规则系统,正是它们生成了,包围被经验的点这群集的曲面,就此而言,鸽子基于所经验的点建构出了范畴(一种由边界曲面诸如皮层区所围成的体积)。无论怎样,都不能由此得出结论说:鸽子有关于树的重要概念,我这里说的概念意思是树的范畴的表示式(树的符号)在其中起着作用的推理演算系统。赫恩斯坦考察的那些实验并不是要测定作出了关于这些自然范畴的推理的系统的存在;它们只是要测定映射过程。它们使人们注意到,对于大脑怎样生成关于诸如树、水、景色之类的刺激的表示式,我们所知道的是多么的贫乏,或者用帕夫洛夫的术语说,关于大脑运用于自然刺激的皮质“分析器”,我们所知的是多么贫乏。(加利斯特,1990b pp.17-18)
3.4无表征的智能
3.4.1布鲁克斯的论点。在对智能建构和开发离不开表征这一人工智能的主流命题的挑战性批评中,布鲁克斯提出了“无表征智能”的论点,并将其具体化于在特殊环境中理智地行动的机器人之中。
人工智能研究已陷入了关于表征的争论。当智能以增量的方式被探讨,从而通过知觉和行动严格地依赖于与真实世界的相互作用时,它对表征的依赖性就不复存在了。在这篇论文中,我们将概述我们对增量式地建立起来的完善的智能造物的研究。智能系统不应被分解为必须借助表征而相互作用的、独立的信息加工单元,而应被分解为独立的、平行的能动产生者,它们经过知觉和行动而直接与世界相互作用,而不是以更特殊的方式相互作用。中枢系统、周围系统之类的概念已去无踪影了——一切既是中心的,又是边缘的。基于这类原则,我们已相当成功地建造了一系列能动的机器人,它们可在标准的办公环境中作为造物无监控地发挥作用。(布鲁克斯,1991,p.139)
布鲁克斯从对AI研究与应用的目标与成就的评估出发,阐述了他的无表征智能命题。
人工智能刚开始是这样一个研究领域,其目的是要在机器中重复人类水准的智力。(www.xing528.com)
由于该目标被发现过于庞大和困难,因此早期的期望渐趋消失。随后的25年中,对智能的个别方面的验证曾取得了缓慢的进步。近来的工作倾向于集中在人类劳动者之“智能助手”的商业化方面。再没有人谈论重复全部的人类智能了。我们所看到的是对特殊的子问题的回归,诸如表征知识的方式、自然语言理解、视觉甚或像真值维持系统或计划验证等更专门的领域。在这些亚区域所做的工作就是用基准问题测试人类在这些方面所做工作的种类。在AI领域的梦幻者中(即是说在那些不是梦想金钱的人中),存在着这样的情感,即在某一天所有的硬币都会掉到地上,进而我们就会“真的”看到智能系统的出现。
然而,我和别的人则相信:人类水准的智能太复杂了,几乎不能理解为在某一时刻可准确分解为适当的子件的东西,即使我们知道了那些事件,我们也还是没法知道它们之间的真正的相互作用。而且只有当我们对更简单水准的智能有更多的实践时我们才能理解怎样分析人类水准的智能。(布鲁克斯,1991,pp.139-140)
在下一段中,布鲁克斯陈述了他的论点:
因此在这篇论文中,我将论述创造人工智能的不同的方案。
*我们必须循序渐进地建构智能系统的能力,在其每一步都有完善的系统,进而自动地保证部件及其相互作用是有效的。
*在每一步,我们应当建立完善的智能系统,使之以真正的感觉和真正的行动在真实的世界自由自在。几乎没有什么东西能提供这样一种我们能以之欺骗自己的候选者。
我们一直恪守着这种方案,并建造了一系列自动的、能运动的机器人。我们已得到了一种意想不到的结论(C),并有了一种相当激进的假说(H)。
(C)当我们考察非常简单的智能时,我们发现:清晰的表征和世界的模型便直接出现了。结果表明用世界作为模型是更好的。
(H)在建立智能系统的最庞大部件时,表征是错误的抽象单元。
表征之成为过去15年人工智能研究中的争论焦点,仅仅是因为它在别的孤立的模块与会议论文集之间提供了一种联系纽带。(布鲁克斯,1991,p.140)
3.4.2增量智能。布鲁克斯指出,他的理智兴趣就是建构能动的机器人,进而把他的工程目标定位于增量智能的概念的来龙去脉之上。
我将建造一种完全自动的、能动的行动者,它们与人类共存于世界之上,并为人类认可是具有自己权利的智能存在。我将把这种行动者称作创造物(Creatures)。这是我的理智动因。对于证明人类怎样工作,我是没有任何特殊兴趣的,即使人类不同于别的动物,是成功的、自动的行动者,因而是这种事业中的有趣的研究对象。我对应用也没有特殊兴趣;在我看来,如果我的目的能实现,那么这种创造物的应用范围将只受我们(或他们)的想象力的限制。我对这种创造物的哲学意义也无特殊的兴趣,即使很显然将会有重大的意义。
那么,现在就把建造创造物的问题当作一个工程问题来看待。为了建造创造物,我们将发展一种工程方法论。
首先,让我们考察我们的创造物的某些必要条件。
*创造物在它的动力环境中必须以流行的随机应变的方式恰到好处地处理问题。
*创造物对于它的环境应当是强壮的;世界的属性方面的微妙变化不应导致该创造物行为的整体崩溃;相反,随着环境越来越多的变化,人们有望看到的只是该创造物能力方面的逐渐变化。
*一个创造物应当能够持有多样的目标,而且能依据它自己所处的环境,改变它正在能动追寻的那些特定目标;因此它既能适应环境,又能利用偶发的环境。
*创造物应当在世界上做点什么;它也有某种生存的目的。
为了获得这些条件,现在就让我们来考察某些有效的工程方案。如同在所有工程工作中一样,有必要把复杂的系统分解为部分,接着建构那些部分,进而把它们连接于复杂系统之中。
(我们的)分析并未在视觉这样的周围系统与中枢系统之间划出界线。相反,对智能系统的基本划分是沿着下述正交方向,即把它分解为产生活动的子系统。每种活动或行为产生系统单独地使感觉与行动联姻。我们把一种活动产生系统当作一个层次。一种活动就是一种与世界相互联系的模式。表示我们活动的另一个名称最好称之为技能,以突出每种活动随后至少能被合理化为对某种目标的追求。不过我们之所以选择活动一词,是因为我们的层次必须决定何时为自己行动,而不是在需要和呼叫某种别的层次时所诉诸的某种子程序。
这一方案的优点在于:它提供了一条从非常简单的系统到复杂的、自动的智能系统的增量路径。在其每一步,只需建立某种微小部件,让它连接于一种现存的、工作着的完善系统。
该观点首要的一点就是要建立一种非常简单的、完善的自动系统,并在真实世界中予以检验。对这种系统,我们所宠爱的例子就是创造物,其实它是能动的能避免损害他物的机器人。它可感觉到它周围的对象,并避开它们,如果它感觉到某物挡在路上,它就会停住。通过把这种系统分解为部分而予以建构仍是必要的,但用不着在“知觉子系统”、“中枢系统”与“行动的系统”之间作出清楚的化分。事实上,可能存在着把感觉连接于行动的两个独立的通道(一个用于发动运动,一个用于产生停止),因此没有这样的孤立的空间,在那里“知觉”传递着传统意义上的、关于世界的表征。
接下来,我们再来建立关于智能的一个增量层次,它平行于第一个系统而运行。它连接于已存的、排除程序中的错误的系统,并且再次在真实世界中得到验证。这个新的层次可以直接通向感受器,并对所传递过来的材料作出不同的演算。第一级自动系统继续平行起作用,而不管第二级的存在。例如,在(布鲁克斯,1986)中,我们已报道过:建立一个初始控制层次,它让创造物避开对象,接着再加一个层次,它设置试图访问远距离可见位置的活动。第二层次把命令加之于第一层次的自动控制部分,指导机器人朝向目标,但是第一层次是独立地促使机器人离开先前未看到的障碍物。第二层次监控那创造物的行进,并发送新的运动命令,这一来在不明确知道障碍物的情况下,它也能实现它的目的,而这先前是由控制的低级层级操纵的。(布鲁克斯,1991,pp.146-147)
3.4.3控制层次。布鲁克斯宣称:在他设计的能动的机器人中,控制层次直接与环境相互作用,而根本不需要表征。
由于多级的层次,因此传递关于世界的描述的知觉概念就变得模糊不清了,当完成知觉任务的系统部分分散于不是由数据通路特殊地关联起来或由功能连接起来的许多部件之中时,情形更是如此。肯定没有这样的可分辨的空间,在其中能发现知觉之“输出”。而且,对传感器的数据的各种完全不同的加工是独立地、平行地进行的,每一个都经过不同的控制通路影响整个系统的活动。
事实上,我们不是通过设计,而是通过观察注意到这样一个共同的主题,那就是:不存在核心表征,基于此,我们的分层和分布式方案才有助于我们的创造物实现我们的目标。
*在反作用于环境中的危险或重要变化时,低水平的、简单的活动会逐渐渗透到创造物中。在没有复杂表征,没有掌握那些表征的必要性、没有对表征的推理的情况下,上述反作用也会轻易地、迅捷地被作出来,以服务于它们的目的。要点在于:要经常不断地感知环境,进而才有关于世界上发生的事情的最新的观念。
*由于有多样的、平行的活动,由于铲除了核心表征的观念,因此世界所拥有的各类属性的任何特定变化就几乎不可能引起系统的整体瓦解。相反,人们可以预料:一给定的变化充其量只会使某些控制层次报废,而绝不会使其全部报废。由于异己世界的逐渐闯入(所谓异己,意思是那个层次所拥有的属性不同于它在其中得到调整的世界的属性),那创造物的行为可能会连续地衰退。由于不想得到关于那个世界的、主要存在于该系统的类似的模型,因此我们几乎不可能固定地依赖那完全准确的模型。毋宁说,个别的层次只是从世界中抽取出了它们发现是有关联的那些方面(阿格雷等,1986)——也可以说是表征在一简单亚区域的那些投射。那世界的根本结构中的变化在它们的每一投射中被反映的机会少于它们在把某种询问匹配于主要的单一的世界模型时作为困难凸现出来的机会。
*每一控制层次可以认为有自己隐含的意图(如果你坚持的话也可以说目标)。既然它们是能动的层次,平行地运行,并与感受器相通,因此它们就能密切注视环境,并选定它们的合适的目标。在环境不允许的情况下,目标有时可能被放弃,而在别的时候,偶然发生的环境又可能被当作是有利的。这里的核心观念是:把世界当作自己的模型,连续不断地把每一目标的前提条件匹配于真实的世界。因为对应于每一层次,存在着一种分离的硬件,因此我们就能为那些能平行存在的多种目标作出匹配,而用不着为更多的目标付出任何代价,如果我们想使单一的加工器,甚至某种具有有限能力的网络的复合加工器越来越复杂,那么我们就能这样去做。
*那创造物的意图隐含在它的更高水平的意图、目标或层次之中。用不着关于下述目标的明晰表征,它们是某种中枢(或周围)过程从决定那创造物下一步最适宜于做什么中挑选出来的。
3.4.4布鲁克斯论点之阐释。在下一节中,布鲁克斯断言:表征的核心不是存在于系统之中,而是限制在AI系统的创立者的心灵范围之内。
正如不存在中枢表征一样,甚至也不存在中枢系统。每一活动产生层次都直接把知觉与行动联系起来。对中枢表征或中枢控制作出归因的正是创造物的观察者。而创造物本身并不如此;它是计算行为的集合。从它们的相互作用的局部混沌中,在观察者的眼中就出现了一连贯的行为模式。根本就不存在中枢的、有目的的控制中心。明斯基(1986)对人类行为怎样产生也给予了相同的说明。
须知,我们并不是断言:混沌是智能行为的必然的要素。相反,我们为该系统内的所有相互作用的精心设计的工程作了辩护(进化经历了漫长的时间阶梯和大量的个体实验,已有丰厚的馈赠,因而也许用不着这种精确的工程就能完成)。
不过,我们坚持认为;让创造物表现智能行为,既用不着关于世界的明晰表征,也用不着它关于那系统的意向的表征。如果没有这样的明晰表征,局部地加以考察,相互作用可能会是混沌和无目的的。
然而,我的主张还不止于此。即使是在局部的水平,我们也没有传统的AI表征。我们从来用不着这样的标记,它们具有可归之于表征的语义学。在我们的补充中,我们所能说的不过是:一个数字从一种加工通向另一种加工。但是只有通过注意第一和第二种加工的状态,那个数字才能得到解释。极端主义者也许会说:我们真的有表征,但它们恰恰是内隐的。随着从完善系统及其状态向另一区域的适当映射,我们就能把一种表征定义为:那些数字和加工之间的拓扑学联系以某种方式得到编码。
不过,我们并不乐意把这些东西称之为表征。在许多方面,它们是不同于标准的表征的。
在推理过程中,不存在着需要例示的变量(例如,关于这一点的更详细的论述,可参阅明斯基,1986)。也不存在需要经过模式匹配挑选出来的规则。更没有什么选择要作出。就大范围而言,世界的状态决定了创造物的行为。西蒙(1969)注意到:一系统的行为的复杂性并不必然内在于创造物的复杂性之中,也许是根源于环境的复杂性。他在描述爬行在海滩上的蚂蚁时作出了这一分析,但当在下一段谈到人类时,则忽视了它的意蕴。我们假设(根据阿格雷等):大多数人类水平的活动同样是经过非常简单的机制而反映世界的,用不着详细的表征。(布鲁克斯,1991,pp.149-149)。
3.4.5可动的机器人。在下一节中,布鲁克斯描绘了他的可动的机器人以及它们的行为、设计与有穷状态机的构成。
我们基于任务分解的方法论,建造了四个机器人系列。它们都运行于一个不受约束的动力世界(实验室和MIT AI实验室中的办公区域)。当人们与它们一道行走,试图干扰它们以及站在旁边注视它们时,它们都有成功的表现。四个机器人在下述意义上都是创造物,即基于增加动力消耗,它们存在于世界上,并与世界相互作用,追求由它们的执行不同活动的控制层次所决定的多种多样的目标。这与别的为特定使命被给予了程序或计划的可动机器人形成了鲜明对比。
四个机器人中……有两个是同一的,因此事实上有三种设计。一是用机外携带的LISP(即表处理解释语言——译者)机器来完成它的大多数计算,另有两个用的是机载联合网络,而另一个用的是一种定做的机载平行加工器。所有机器人都具备相同的抽象结构,我们称之为归类构造。它包含有关于完成任务的行为层次的分解以及经过真实世界的调整增量合成的根本观念。关于这些补充的细节可参阅(布鲁克斯,1986)。
归类构造的每一层次都是由一个固定的、具有简单有穷状态机的拓扑学网络构成的。每一有穷状态机有少量的状态,一个或两个内在的寄存器,一个或两个自动按时操作装置以及到达简单计算机的通道,该计算机能计算像矢量和之类的东西。有穷状态机异步运行,发送和接收线路上的有固定长度的信息(在两个小机器人上的1-bit信息,在更大的机器人上的24-bit信息)。在我们的第一个机器人上,这些就是虚拟线路;在我们后来的机器人上,我们就用物理的线路连接计算元件。
根本就不存在控制中心。毋宁说,有穷状态机就是由它们所接收到的信息从数据上驱动的。信息之到达或所设计的时间期满就引起有穷状态机改变状态。它们还有通向信息内容的渠道,也许会输出它们,以一种谓词予以检验,并有条件地划分成不同的状态,或者把它们传递给简单的计算元件。不可能有通向整体数据的通道,也不会有动力学上建立起来的通信链。因而不可能有整体的控制。所有有穷状态机都是单一的,不过它们同时又是它们的固定的拓扑学连结的囚犯。
诸层次是由我们称之为抑制(归类构造的名称由此而来)和阻止的机制结合起来的。在两种情况下,由于加上了新的层次,因此新的线路之一就从旁侧连通于已存的线路。前定的时间常数与每一旁侧-连通都有联系。在抑制的情况下,旁侧-连通发生在有穷状态机的输入端。如果一种消息到达了那个网状线路,那么它就指向有穷状态机的输入端口,好像它已到达那已存的线路。此外,在已存线路上的任何新的消息在指定的时间内都会被抑制(即被拒绝)。就阻止而言,旁侧-连通发生在有穷状态机的输出端口。新线路上的消息在指定的时间内仅阻止信息在已存的线路上的发送。不像抑制那样,新的消息不会送到它们里面。
更详细地说,三个层次以下述方式起作用:
(1)最低级的层次执行使机器人(创造物的物理体现)避免有伤害对象的行为。它既回避静止的对象,又回避运动的对象,甚至回避那些能动地攻击它的东西。被称之为声纳系统的有穷状态机操纵的不过是声纳装置,每秒钟都释放载有被转变为极坐标的读数的瞬时图式。这种图式传送到对立的、有感受力的有穷状态机中。第一级不过是注视,以查明先前是否有无用的东西,如果是这样,就提前给负责操纵机器人的有穷状态机发送停止的消息——如果那有穷状态机不在正常的状态,那么消息就会被忽略。与此同时,另一有穷状态机基于平方反比定律计算对于机器人的推斥力,在这里,每种声纳的返回都被认为标志着有推斥力对象之存在。来自每一声纳的东西叠加起来,就产生出作用于机器人的全部力量。输出传到逃跑机,后者发动它,并将其送至转换机,它又使机器人直接离开总合的推斥力。最后,前溯机促使机器人向前行进。这种机器在机器人向前驱进时,不管何时接收到停止消息,它都会命令机器人停下来。
有穷状态机的这种网络产生出让机器人避让对象的行为。如果让它从空房间中央开始,那么它就只会坐在那里。如果某人走向它,它就会走开。如果它朝别的障碍物的方向运动,它就会停下来。总的说来,它能设法存在于一种动力学环境中,而不伤害对象或被对象所伤害。
(2)下一层次使机器人在不忙于避让对象的情况下行走。行走的有穷状态机大约十秒钟为机器人提供一个随机的导向。避让机把这种导向当作一种吸引力,并把它与从声纳系统计算出来的推斥力加以总合。它用这一结果来抑制低水平的行为,迫使机器人朝着接近于行走既定的方向前进,当然同时又要避让各种障碍物。要注意的是:如果转向与前进有穷状态机忙于驱使机器人行进,那么新的行走冲力就会被忽略。
(3)第三个层次使机器人尝试着探险。它寻找远距离的空间,进而设法到达那里。这一层次抑制行走层次,观察基底层次怎样根据障碍物而使机器人发生转向。它纠正各种偏差,进而机器人才达到目的地。
何时看(when look)有穷状态机关注机器人何时用不着忙于行走,并发动自由空间定位程序……有穷状态机。同时它抑制行走行为,以便让观察仍然有效。当一种路径被发现了,它就被传递给路径筹划有穷状态机,后者又把被指定的方向送至避让有穷状态机。这样,低级障碍物避让仍继续发挥作用。这就能促使机器人朝着不同于路径筹划所期盼的方向前进。由于这个理由,机器人的实际路径是由整合有穷状态机决定的,它给路径筹划机发送最新评估。因此,这种机器作为一种不同的发动机而起作用,它迫使机器人朝向所期望的方向,并为机器人在回避障碍物时补偿实际的路径。
这些特殊的层次,在我们最初的机器人身上都得到了实现。要知详情,请看[布鲁克斯,(1986)]。布鲁克斯和康奈尔(1986)报道:另三个层次在那特殊的机器人上也运行成功了。(布鲁克斯,1991,pp.150-154)
3.4.6与别的构造的比较。在下一节中,布鲁克斯比较了他的归类构造与联结主义、中枢网络、产生规则、黑板构造之间的异同。
归类构造以其简单的机械网络至少在表面上使人联想到对于智能的许多机械论方案,诸如联结主义和中枢网络。但是它在许多方面又不同于这些工作,而且也相当有别于人工智能中的许多别的后达特茅斯(post-Dartmouth)传统。在下面,我们将非常简要地解释这些差异。
(1)它不是联结主义。联结主义者试图造出简单加工器的网络。在这方面,他们所建构的东西(仅只是模仿——联结主义者从未让真实的机器人在真实的环境之中行走,不管多么简单)相似于我们所建构的归类网络。不过,他们的加工节点倾向于统一,而且他们试图从对怎样正确把它们直接关联起来(这常常被假定有丰富的意义)的理解中寻找启发(正如他们的名称使人联想到的那样)。而我们的节点都是独一无二的有穷状态机器,联结的密度是相当低的,因而肯定是不一致的,在层次之间肯定是很低的。此外,联结主义者似乎寻找明确的、分布式的、从它们的网络中自发产生的表征。我们则完全没有这种希冀,因为我们相信:表征并非必要,只出现于观察者的眼或心中。
(2)它不是中枢网络。中枢网络是联结主义最近得以转世的基质。致力于中枢网络的人断言:他们的网络节点有某种生物学意义,就像神经元模型那样。假如少量被模拟的联结与真实神经元中所发现的无数联结有关,那么大多数模型似乎不大可能。我们认为:我们把有穷状态机挑选为网络节,并没有什么生物学意义。
(3)它不是产生性规则。我们的构造的每一个别的、有活动力的产生层次都能被视之为一种产生性规则的实施。当适当的条件在环境中出现了,那么一定的行动就会做出来。我们觉得:这类似于说:带有IF陈述的FORTRAN(指公式翻译程序语言——译者)程序会执行产生性规则系统。标准的产生系性统更是如此——它有一规则基础,从这里,一种规则基于把所有规则的前提条件都匹配于某些基础性材料而被挑选出来。前提条件可以包括必须匹配于基础性材料中的个体的变量。我们的层次是平行地运行的,而且没有变量,或者说不需要匹配。世界的诸方面是抽象出来的,它们直接引起或纠正那一层次的某些行为。
(4)它不是黑板。如果人们真的想将我们的网络与黑板控制构造进行类比,那么他们能得如所愿。某些有穷状态机是局部化的知识源泉。而其他的则是通过在黑板上找到这些知识源泉而作用于它们的加工。不过,在我们的构造中则有简单明了的特点,即所有加工实际上知道观看黑板的什么地方,就像它们实线连接于确切的位置一样。我认为这种牵强的类似性显示了其自身的弱点。根本就不存在这样的伸缩性,加工能在这里搜集到相应的知识。大多数得到改进的黑板构造过多地利用了几乎所有知识的普遍成分和效用。而且至少就精神实质而言,黑板系统往往把知识的消费者隐藏起来,而后者正是特殊的生产者。在黑板系统中,这是抽象的初级方法。而在我们的系统中,我们则使这种联系明朗和持久。
3.4.7机器人设计的目的。布鲁克斯认识到,就智能进化的等级体系而言,他的机器人尚处在原始水平。机器人智能的进步有赖于他的一般研究战略之成功完成,就像下一段所讨论的那样。
既然我们的方案是一种以行为为基础的方案,因此,我们要建构的正是系统的行为,它必须适用于评估它的有用性,并指明其局限性。
我们认为:1987年中期,我们的机器人由于用归类构造来补充完善的创造物,从而成为当时反应最敏捷、最实时的能动机器人。而其他大多数机器人仍停留于静力学环境或充其量在完全被映射的环境中的个体的“实验运行”阶段。另一方面,我们的机器人在它们自己的开关啪嗒一响时,便完全自动运行于复杂的动力学环境中,直至它们的电池用完为止。我们相信:它们以更接近于简单昆虫的智能水平运动,而远胜于细菌水平的智能。我们的目的(如果我们不说出来,就毫无价值)就是在两年内达到简单的昆虫水平的智能。从单细胞到昆虫的进化花了30亿年,从昆虫到人类又花了5000万年。这一陈述无意于作为对我们未来行为的预言,毋宁说它表明的是昆虫水平的智能的重要本质。
尽管迄今已有如此骄人成绩,但我们的方案仍然存在着许多严重的问题。这些问题怎样被解决,对此我们充满信心和期望,但根据我们自己的标准,真正重要的是要脚踏实地。实验、建构复杂的系统要花时间,因此要说明的是,下面所述的实验尚未完成,只能略述我们现在怎样看待我们工作的进展。我们讨论这一点的意图就是表明:从我们现有的条件出发迈向更高的智能机,至少存在着一条合理的道路。
我们的信念是:我们正开发的各种产生活动的控制层次(灵活性、视觉以及与困难工作相关的生存)是以我们赋予人类的那种方式表现出来的更高水平智能的必不可少的前提条件。(布鲁克斯,1991,p.156)
3.4.8机器人设计的限制。在下一节,布鲁克斯对自己的研究纲领作出了评价。
关于我们方案的限制,最自然而严重的问题就是:
*在每个层次之间的相互作用变得太复杂以致难以继续之前,归类构造中可建构多少层次?
*不借助中枢表征而开发的行为能达到什么样的复杂程度?
*学习之类的高水平功能能发生在这些由简单有穷状态机构成的固定的拓扑学网络中吗?
下面谈谈我们对这些问题的最新想法。
(1)多少层次?我们已述及的物理机器人的最多层次是三个。在模拟中,我们用过六个平行层次。在设计和增加一个新的层次之前,在所有现存的产生活动的层次上完善地调整机器人的技术,至少到目前为止似乎一直处在实践之中。
(2)怎样复杂?在我们的、大约需要14个个别的活动产生层次的第四代机器人上,我们目前正在研制一种复杂的行为模式。
该机器人有适于避免局部障碍物的红外接近感受器。它还有这样的机载控制器,它能抓住地面和桌子上的对象,并能确定它们的大致重量。其手有安放于其上的深度感受器,以至于可抓住目标对象,可直接控制对目标对象的追踪。我们正在研究一种结构化的激光扫描器,以确定机器人前溯方向上的粗略深度图像。
我们设法在这个创造物身上设置的高水平行为就是在我们的实验室的办公区行走,寻找敞着的办公室的门,并走进去,从密集的办公室中的乱七八糟的桌子上取出空氧化钠容器,最后把它们放回中心仓库。
为了完成这整套行为,完成更简单任务的大量行为就是必不可少的。它们包括:避让对象、循着墙走、识别门径、走进去、校准熟悉的界标、逆着返回方向行走、在界标处辨认返回方位、继续行走、找出似桌子的对象、靠近这种对象、在桌面上搜寻具有氧化钠容器大致高度的圆柱形对象、伸出操纵器的手臂、在被感知对象上移动手臂、用手的感受器从背景中找出竖着的、像氧化钠容器大小的对象,如果它们足够轻就予以抓住,进而把对象存放起来。
个别任务用不着任何中心控制器的协调。它们能把世界的状态编成索引。例如抓握行为能使操纵器抓住由手的感受器识别的、具有适当大小的任何对象。不过,机器人不会随机地抓握这样的对象,因为只有当别的层次或行为注意到似桌子的对象上大致有适当形状的对象时,抓握的行为才会在它关于世界的感知让它起作用的地方展示自己。由上可知,如果一对象看上去不再像氧化钠容器,那么抓握反射作用就不会发生,别的低水平行为将让机器人在别的地方寻找新的候选物。
(3)是学习吗,有这种可能吗?某些昆虫显示有一种被称为“本能的学习”的简单的学习类型(古尔德等,1986)。据假定,如蜜蜂生来就知道怎样区分各种花,知道往返于蜂箱与花源之间的路线。别的昆虫如蝴蝶已表明能学会对花的区分,但用的是一种信息限定的方式(刘易斯,1986)。如果它们被迫熟悉了第二类花,它们就会忘记关于第一类花所知道的东西,这在一定程度上表明:它们所知的信息总量是不变的。
我们已找到了一种为我们的有穷状态机建构固定的拓扑学结构的方法,它们能作为一孤立的子系统、以能与上述实例相媲美的水平完成学习任务。此刻,我们所处的正是这样的立场,据此我们在本文中对早期的大多数AI工作者作出了猛烈的抨击。我们只有关于系统工作的孤立的模数,而输入与输出仍是飘忽不定的。
我们还在努力,以改变这种局面,但是对物理的创造物的实验工作是一项重要的、需要耗费时间的活动。我们发现:关于装置或软件的任何预先设计的组件几乎都有如此多的、它们应怎样成为它们的部分的前概念,以致它们并没有足够的灵活性,不足以成为我们的完善的系统的组成部分。于是到1987年中期,我们对学习的研究工作便以下述需要为转移,即建立一种新的电视摄像机和高速低耗的加工箱,以操纵特别地开发的、以每秒10幅画面出现的视觉规则系统。这一工作的每一步都是一种有意义的工程学事业,我们正以财力所允许的速度向前推进。
当然,空谈是不费力气的。
(4)前瞻。对于在实在世界的真实创造物的实验只能解答关于我们的方案的常见的疑惑。而时间将作出判决。(布鲁克斯,1991,pp.156-158)
3.5评论
布鲁克斯(1991)提出了无表征的智能的命题。不过他并未对表征作出清晰的定义。什么东西构成表征系统,这一直为帕尔默(1978)所重视。图2借助五项联结条件定义了表征系统。最后一个条件规定了模型的适当方面与环境的适当方面之间存在的一致性或同型性。
表2 表征系统的定义性条件
就布鲁克斯(1991)设计的机器人而言,一致性出现在环境的适当信息方面与机器人的适当信息方面两者之间。机器人的电子设备中的信息加工是由图式或有穷状态图表表征的。图式构成了表征系统,而该系统又确定了环境中的信息流和机器人的电子设备中的信息流之间的一致性。智能就存在于表征系统所在的地方。
4.表征与关于动物、计算机和人类心灵的理论
即使表征存在于动物、计算机和人类的认知之中,但对心灵状态(知识、信念和情感)作出归因的能力在人类身上则得到了充分的发展,而在计算机上可能只存在于有限的范围,在大多数动物身上压根就不存在或残缺不全。动物能与它们的同类进行有意义的交流,但是这种交流并未顾及交流接受者心中所存在的有知或无知的区别。关于心灵的理论不能归之于动物。使其行为适合于另一计算机或人类的有知或无知水平的计算机掌握了关于心灵的有限的理论,所谓有限是指自身程序的范围和力量的有限。
关于猴子有心灵理论的研究在下面的说明中有简要的介绍。
我们的发现……并不能说明猴子的叫喊能否上升到人类词语的地位。人类语言涉及到的远不只是词语与其所指示的对象或事件之间的指称关系。在交流信息时,我们也把知识、信念和愿望之类的心理状态归之于他人。我们认识到:心理状态具有因果力量……我们曾想知道:猴子能否在它们自己的信念、知识与别的猴子的信念之间作出区分,它们在通知不知道的个体或纠正别的猴子的错误信念时是否采取了特定的步骤。
动物可能对别的动物的心理状态敏感这一类想法来自于新近在不同鸟和哺乳动物身上所做的听众效应的研究。马勒近来在丹佛的加利福尼亚大学与其同僚重做了N.廷伯根的一个古典实验,在该实验中,一老鹰的剪影模型悬挂在一根电线上,接着一群原鸡从此“飞过”。马勒发现:公鸡在母鸡出现时发出了令人震惊的叫声,但是当它们独自与别的种类的雌性在一起时则仍保持安静。在野外,康奈尔大学的P.舍曼发现:成年雌性的松鼠有其近亲在场比无近亲在场发出惊叫的可能性更大。在对被捕捉到的雌性黑长尾猴的实验中,我们注意到:成年雌性在与自己的后代在一起比与年龄、性别相同但无亲属关系的黑长尾猴在一起所发出的惊叫要多得多。
即使动物对听众在场或缺席显然很敏感,但这一事实并没有证明:它们对它们听众的心理状态也是敏感的。而且有广泛的证据表明:动物并不能识别无知听众与有知听众之间的差异。例如,公鸡与黑长尾猴在它们的同伴看到捕猎者并逃跑之后仍继续长时间发出惊叫。
为了在猴子身上验证心灵理论,我们在丹佛的加利福尼亚灵长目动物研究中心对两群罗猴短尾猴和两群日本短尾猴进行了实验。
对动物信息沟通的研究不可避免地与对动物怎样思维的研究牵连在一起。我们对黑长尾猴的研究允许我们作出如下结论:灵长目动物发出的声音不仅是本能的尖叫声,而且是个体有选择地使用的叫唤,这些个体注意到它们的听众,并用不同的发声作为表示它们环境的不同特征的信号。猴子的叫唤像语词一样起着指示不同对象或事件的作用,而猴子自身甚至可以认识到叫声与对象或叫声所表示的概念之间的指称关系。
同时,我们正着手对猴子的信息沟通与认知怎样不同于人类的作出更明确的理解。即使人类的大多数信息沟通旨在影响引起行为的知识、信念与动机,但现在还没有根据说:猴子在沟通时也带有影响别的动物的心理状态的意图。猴子,甚或类人猿不可能带着改变别的动物的心理状态的意图进行信息交流,因为它们显然没有认识到这种心理状态的存在。(赛发思等,1992,pp.126-128,出自R.M.赛发思等“意义与猴子的心灵”,1992,《科学美国人》)
参考文献
R.戴维斯和H.施罗伯(1983):“表征数字硬件的结构和行为”,《IEEE计算机》,16(10),75-82。
R.戴维斯、H.施罗伯和P.索络维茨(1993):“什么是心理表征?”《AI杂志》,14(1),17-33。
H.波朴尔(1982):“把结构加之于有结构毛病的问题的启发式方法”,载P.索洛维茨编:《医学中的人工智能》,美国科学促进协会会议论文集,51。
M.明斯基(1975):“知识表征的构架”,载P.温斯顿编:《计算机视觉心理学》,纽约:McGraw-Hill.
M.明斯基(1986):《心灵社会》,纽约。
C.加利斯特(1989):“动物的认知:关于时、空、数的表征”,《心理学年鉴》,40,155-189。
C.加利斯特(1990a):《学习的组织》,麻省理工学院出版社。
C.加利斯特(1990b):“动物认知中的表征导论”,《认知》,37,1-22。
R.布鲁克斯(1986):“可动机器人的、强有力的、分布式控制系统”,《IEEE自动机器人杂志》,2,14-23。
R.布鲁克斯(1991):“无表征的智能”,《人工智能》,47,139-159。
S.斯蒂文斯(1946):“关于测量标准的理论”,《科学》,103,677-680。
J.吉本等(1981):“剩余的时间:线性式与对数式主观时间”,《实验心理学杂志》,7,87-107。
K.程(1986):“鼠的空间表征中的纯几何学模型”,《认知》,23,149-178。
B.卡特赖特和T.科利特(1979):“蜜蜂怎样知道它们离附近视觉界标的距离”,《实验生物学杂志》,82,367-372。
B.卡特赖特和T.科利特(1983):“蜜蜂的界标学习:实验与模型”,《比较心理学杂志》,151,521-543。
R.维纳(1981):“节足动物的空间知觉”,载H.奥特朗编:《比较心理学与无脊椎动物的视觉进化手册》,纽约,pp.287-617。
H.西蒙(1969):《人造物的科学》,麻省理工学院出版社。
S.帕尔默(1978):“认知表征的基本方面”,载E.罗施等编:《认识与范畴化》,希尔斯代尔。
J.古尔德等(1986):“本能的学习”,《科学美国入》,pp,74-85。
【注释】
[1]译自莫顿·韦格曼:《人类理智与认知科学》,普雷格出版公司,1966,第1章。本章每一部分,围绕有关问题,选录了反映诸家有代表性的观点的原文资料,因此是了解本领域进展的一较全面的、极有价值的“原著”荟萃。文中分节序号为译者所加。
[2]指一种医学上的咨询系统。原意即“内科医学”,指的是医学上的诊断系统。
[3]指一种医学上的咨询系统。原意即“内科医学”,指的是医学上的诊断系统。
[4]指光谱结构不同而看上去完全相同的两种颜色。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。