Ⅰ.导言
在T.库恩发表《科学革命的结构》一书以后的岁月里,科学革命一词以与日俱增的频率应用于关于科学变革的讨论之中。在某人或别的人被诱使把一种革新称之为一场革命之前,这场革新所必须具有的重要性便奇怪地去无踪迹了。本章的主题是:如果联结主义的一系列假说被证明是正确的,那么它们便肯定可算作是革命性的,即使根据严格的前库恩标准也是如此。毫无疑问,联结主义已经经历了许多重大的变化,就像许多认知科学家所设想的认知一样。不过,正如我们所看到的那样,使某些联结主义模型成为名副其实的革命模型的东西就是它们为一种彻底的取消论提供了支持,这种取消论要取消的是常识(或“民众”)心理学的核心假定。我们这里集中讨论的是信念或命题记忆,即使论证已直接泛化到所有其他命题态度上。如果我们是对的,那么这类联结主义的结论将超出认知科学的疆界,因为这些模型如果是成功的,那么就有必要彻底改变方向,就像我们对自身的思考一样。
这里先对要论述的作一简要的概述。第2节扼要说明了取消论的主张,接着描述了取消论论证一般必需的两个前提。第3节阐述了我们关于民众心理学及其所假定的命题态度的看法。进而阐释了一种利用民众心理学假定并以之为基础的心理学模型。第4节是专论联结主义的。被称之为联结主义的那些模型已形成了一种模糊的、异类合成的集合,其成员经常表现出的不过是粗略的家族相似性。不过,我们把联结主义与取消论结合起来的论证将只限于联结主义模型的有限范围,即以特定方式予以解释的范围;第4节的主要任务就是讨论:这个范围是什么,此范围内的模型应怎样被解释。在第5节中,我们将说明:与我们的限定相一致的联结主义信念模型可能是什么样子,然后我们再进一步论证:如果这类模型是正确的,那么结果对常识心理学将极为不妙。第6节汇集了一些反对意见及答复。最后一节是简要的总结。
在具体论述之前,我们应强调的是:我们打算辩护的论点是一种条件论断:如果我们概述的那类联结主义假说最终是正确的,那么取消主义关于命题态度的观点也是如此。既然我们的目标只是表明,联结主义与取消主义怎样相互关联,因此我们用不着花力气去论证两个学说哪一个真,哪一个假。尤其是我们用不着为赞成我们的条件句之前件所必需的联结主义观点提供论证。确切地说,我们的观点是:满有把握地断言这类联结主义假说家族将怎样健康发展,还为时尚早——太早了。那些诚信联结主义的人自然会诉诸于我们的条件句,将其作为铲除命题态度的更大的论证的一部分。①但是正如J.豪格兰德曾说明过的那样,一个人的权利(ponens)就是另一个人的失去(tollens)。那些接受取消主义关于命题态度是荒谬的或不可思议的观点的人很可能把我们的论证当作反联结主义的更大的理由的一部分。因此如果对联结主义的强有力批评者,如福多和皮利辛,发现我们的条件句和论证是相当协调的,那么我们丝毫不会大惊小怪。②
Ⅱ.取消主义和民众心理学
作为我们要用的术语的取消主义是为表述一简单论点而想象出来的名称。它主张,在对世界的常识或科学解释中所使用的、表示实在、过程或属性的某些范畴并不存在。如果这样来理解,那么我们都是关于许多类型的事物的取消论者。在民众理论的领域内,巫婆是标准的例子。曾经在某一时期,巫婆被广泛相信对各种地区性的灾难负有责任。但是人们渐渐相信,对与巫婆有联系的大多数事件可作出更好的解释。不存在只有巫婆才能完成的解释工作,因此明智的人断言:根本没有这回事。在科学的范围内,燃素、热的流质和传光的以太是取消主义津津乐道的例子。其中的每一个曾为实施复杂研究计划的严肃的科学家所援引。但在每种情况下,计划在主要方面均告搁浅,因此那些诉诸于这些实在的理论便为后续的、不给这些实在以地盘的理论所取代。科学共同体逐渐认识到:燃素之类根本就不存在。
正如这些例子所暗示的,取消主义论证中的关键步骤一般来说就是证明:在其中诉诸于某些所谓的实在或过程的理论应予拒斥,而由更好的理论所取代。这便引出了下面的问题:我们将怎样说明一种理论比另一种更好呢?众所周知,提出此问题比给予回答要容易得多。不过,下述观点也得到了相当广泛的认可,即如果一种新的理论比旧的理论提供了更准确的预言和更好的解释,而且能适用于如此广泛的现象,如果新的理论能更好地与相邻领域完善地建立起来的理论相谐并进,那么就有理由认为:旧的理论是低劣的,新的理论是应予接受的。对于我们的目的来说,这尽管是足够的,但是几乎不能算作是对于一种理论优于另一种理论之条件的完满的说明。
不过,仅仅说明一类实在在其中起着作用的理论次于后续的理论,还不足以说明那些实在不存在。通常,更妥当的结论是:被拒绝的理论对在它的范围内的实在的某些属性或主宰这些实在的规律的看法是错误的,也许有严重的错误,而新的理论对那些实在为我们提供了更准确的说明。例如前哥白尼宇宙学对行星的本质、制约其运动的规律的看法就是非常错误的。但是说哥白尼和伽利略已说明了托勒密所说的行星不存在则又多少有点滑稽。③
在其他事例中,得到正确断定的东西是:旧理论的假定可还原于新理论的假定。这里的标准例子有:温度可还原于平均分子动能,声可还原于介质的波动,基因可还原于一系列的多核苷酸碱基。④基于这些流行的看法,就可从这些事例引出下述教训:即使命题态度由此发源的常识理论应被更好的理论所取代,但这还不足以表明:常识理论的假定不存在。
还需要什么呢?把一方面的如燃素、热质之类的事例与另一方面的如基因或行星之类的事例区分开来的东西是什么?或者换一种方式表述这个问题:什么使燃素、热质之类成为被排除的候选者?为什么不能得出这样的结论,即燃素就是氧,热质就是动能,早期理论关于燃素和热质的某些属性的看法正好是极端错误的?
让我们引入一些术语。我们将把下述理论变革称之为本体论上保守的理论变革,在这种变革中,旧理论的实在和属性被保留下来了或被还原为新理论中的实在与属性。在本体论上不具有保守性的理论变革,我们将称之为本体论上激进的变革。基于这些术语,我们将提出的问题便是:怎样把本体论上保守的理论变革与激进的理论变革区别开来。
这还是一个容易提出而难以回答的问题。在科学哲学文献中,对于理论变革何时支持取消论结论,何时不支持,根本就找不到近乎合理与完全一般性的说明。在缺乏确定本体论上的排除何时为宜的根本方法的情况下,我们所能做的充其量是,考察旧理论的假定——有被取消危险的假定——然后探讨在新的理论中是否有这样的东西,即可能被同一的或被还原的东西。如果新理论的假定给我们的印象是,在深层次上、在根本上不同于旧理论的假定,就像分子运动在深层次上、在根本上不同于热质理论所假定的“异常活跃的”流质,那么便可合理地断言:理论变革是激进的,取消主义的结论是稳妥的。既然对于两个假定究竟怎样“在深层次上、在根本上不同”没有简单明了的标准,因此我们所到达的结论就一定是一种判断预期。⑤
为了证明某些联结主义模型支持关于命题态度的取消主义,我们就必须论证这些模型不是本体论上的保守模型。我们的战略是,把这些联结主义模型即类似于第5节中要解释的那些模型与第3节后面要叙述的那样的本体论上保守的模型加以对比,以突出联结主义模型在本体论上如何激进。但是在这里,我们正在超越自我。在设法让你相信联结主义模型是本体论上激进的模型之前,我们必须考察一下联结主义模型扬言要取代的民众心理学理论。
Ⅲ.命题态度与常识心理学
为了现在的目的,我们将假设:常识心理学可以合理地看作是一种理论,信念、愿望和其他的命题态度,可以合理地视之为该理论的假定。即使这不是一个没有争议的假设,但其他的人已精彩地阐述了关于它的理由。⑥一当承认常识心理学真的是一种理论时,我们就可以预期,几乎每个人都会承认:该理论是被取代的一个可能的候选者。我们这样说,无意于毁谤民众心理学,或以假定为根据论证它所假定的实在的地位。我们的观点很简单,那就是,民众在心理学方面的智慧不可能把应知的一切都告诉我们。常识心理学像其他民众理论一样在许多方面注定是不完善的,在更多的方面很可能是不正确的。如果事实不是这样,那么细致的、定量的、实验的心理学科学就是多余的。除了一些顽固的维特根斯坦分子这样的可能例外,几乎每个人都乐意承认:在内在于常识的事实和原则之上,还有许多心理学的事实和原则。如果这是对的,那么我们就有取消主义针对信念、命题记忆和其他命题态度的论证所需要的第一个前提。假定这些态度的理论的确是要予以取代的第一个候选者。
即使常识心理学包含了关于信念、记忆、愿望、希望、恐惧和别的命题态度的经验知识财富,但在构造联结主义与取消论之间的联系纽带的过程中,重要的民众心理学信条是这样的主张,即命题态度是功能上具体的、语义上可解释的状态,它们对别的命题态度的产生、最后对行为的产生有因果作用。按照斯蒂克(1983)的这个建议,我们把这组主张称之为命题模块性(modularity)。⑦(读者一定要当心,不要把命题模块性这个概念与福多(1983)所辩护的非常不同的模块性概念混淆起来了。)
可以援引大量的证据,以支持这样的论点,即:民众心理学承诺了命题模块性信条。常识心理学认为,信念和别的命题态度有语义属性,这一事实已得到了特别的强调。根据常识:
(1)当人们看到附近有一条狗时,他们一般会相信附近存在着一条狗。
(2)当人们相信:如果山上有雪,那么火车就会晚点,进而确实相信:山上有雪,那么他们一般会相信:火车要晚点。
(3)当讲英语的人说,“花园里有只猫”时,那么他们一般会相信:花园里有只猫。
如此等等,以至无穷。须知,这些常识心理学的普遍原则是依照态度的语义属性而予以表达的。正是由于有信念p,特定的信念才有特定的结果或原因。因此常识心理学把表达了这些语义属性的谓项,如“相信火车晚点”这样的谓项,当作是可投射的(p rojectable)谓项——恰当地运用于法则学的或准法则的普遍原则中的那类谓项。
民众心理学赞成命题态度就是功能上具体的状态这一论点,而阐明这一点的最好的办法就是指出:它常能完满地澄清下述主张的意义,即一个人已获得(或失去)了一个记忆或信念。例如,在特定的情况下,大概可以合理地断言:当亨利打盹后醒来时,他完全忘记了汽车钥匙藏在冷藏室中,即使他没忘记其他的事情。在说民众心理学把信念当作能为一个人同时得到或失去的那类东西时,我们无意于否定:拥有任何特定的信念可能以有关信念的基本网络为前提。相信汽车钥匙在冷藏室中这样的信念不是原始部落的人所能获得的那种信念,因为他们对汽车、钥匙或冷藏室一无所知。但是一当有关的背景出现了,正如我们设想它有利于我们和亨利那样,民众心理学似乎可以与下述可能性完全一致起来,即一个人可能得到(或失去)汽车钥匙在冷藏室这样的信念,而他的其他信念依然如故。命题模块性自然不否认:获得一个信念常常导致一组有关信念的获得。当亨利被告知:钥匙在冷藏室时,他可能会相信:钥匙没有丢在点火装置或他的夹克口袋里。但是下一次,他又不可能如此。甚至,根据民众心理学关于信念的概念,一个人完全可能有这样的持续甚久的信念:钥匙在冷藏室中,但却继续在卧室搜寻。⑧
为了说明民众心理学以此把命题态度当作功能上具体、因果上能动的状态的方法,让我们叙述两个更复杂的例子。
在常识心理学中,行为常常诉诸于行动者的某些信念和愿望予以解释。因此,为了解释艾丽斯为什么要到她的办公室,我们可能会说她想发送一些电子邮件(而且她自然相信,她在办公室能做到这一点)。然而在某些情况下,行动者有几组信念和愿望,其中每一个都可能导致相同的行为。这样一来,我们就可以假定,艾丽斯还想与她的研究助手谈谈,她相信他在办公室里。如果是这样,常识心理学就会假定:艾丽斯去她的办公室可能是由两个信念/愿望中的某一个引起的,或同时由两者所引起,确定这些选择中的哪一个付诸实施是一个经验问题。因此完全有这样的可能,即在这种情况下,艾丽斯发送电子邮件的愿望在产生她的行为时并未发挥作用。事实上,正是想与她的助手谈话这样的愿望促使她上办公室。不过,如果她不想与她的助手谈话,那么她也有可能去办公室,这是因为发送电子邮件的愿望,该愿望在实际作出决策时并未发挥原因的作用,但后来可能积极地卷入了。须知:在这种情况下,常识心理学愿意承认两种非常不同的、从语义学上被描述的状态,其中一个在因果上是能动的,而另一个则相反。
我们的第二个说明类似于第一个说明,但侧重于信念与推理,而不是愿望与行动。根据常识观点,有时候可能碰巧有这样的情况,即一个人有大量的信念串,其中任何一个都可能使他推论出某种别的信念。当他实际作出了推理时,民众心理学就假定:他根据什么把它推论出来,这是一个经验问题,而且这个问题一般有一个确定的答案。例如,假设检查官克洛斯相信:男管家说他在乡村旅店过了夜,他还说他是乘早上的火车回来的。假设克洛斯还相信:那个乡村旅店在那个季节关了门,早上的火车取消了。假如有这些信念以及某些普遍共有的背景信念,那么克洛斯很可能推论说,那个男管家在撒谎。如果他这样做了,那么民众心理学就会假定:那个推论要么是基于他关于旅店的信念,要么是基于他关于火车的信念,或者两者兼而有之。从常识心理学的观点看,完全有这样的可能:即使克洛斯早就知道哪个旅店在那个季节关门了,但在这种特殊的情况下,这个信念在他的推理中并没有起什么作用。再者,我们知道,常识心理学诉诸于两种不同的命题态度,其中之一在特殊的情况下是能动的,而另一种是无因果作用的。
在心理学文献中,不乏关于人的信念或记忆的模型,它们步常识心理学的后尘,假定命题模块性是真实的。而且,先于联结主义而出现的、几乎所有的关于命题记忆的模型,除行为主义者所强调的那些以外,都非常和谐地见容于命题模块性。一般来说,这些模型把主体的信念或记忆储存当作是一堆相互联系的状态,这些状态在功能上是具体的、在语义上是可解释的,并以系统的方式相互作用。其中一些模型把个体的信念表征为似句子的结构——一串符号,通过把它们从长期记忆输送到中心加工单元的更有限的记忆,它们可以个别地被激活。另一些模型把信念表征为标记节与标记链的网络,激活的模式正是由此而扩散的。还有一些模型把信念当作产生性规则的集合。⑨在所有三种模型中,一般有这样的情况,即对于任何特定的认知阶段来说,如完成特定的推理或解答一个问题,某些记忆状态就会主动地被卷入,而别的则停止起作用。
图2
在图1中,我们将用柯林斯和奎利恩(1972)的方式展示记忆的“语义网络”表征的一个片断。在这个模型中,记忆中的每一不同命题都为一种椭圆形的节所表征,这个节又与它的关联于各种概念的标记链连在一起。通过增加下述假定,它们是关于问题或其他类型的记忆试探电极导致激活扩散到那个网络的方式的,该模型就使我们能对各种记忆实验研究的速度和准确性作出预测。就我们的目的而言,关于这一模型的三个事实都具有特殊的重要性。第一,既然每一命题都以功能上具体的方式被编码,那么直接有关的就是从记忆中加上或减去一个命题,而让网络的其余部分保持不变。例如图2就描述了从图1的网络中减去一个命题的结果。第二,该模型把表达了信念或记忆的语义属性的谓词当作是可投射的。⑩它们被看作是这样的谓词类别,即从科学上遴选出来的名副其实的类别,而不是纯偶然的集合体,因而适合于包含在关于似规律的规则的陈述之中。为了说明这一点,我们只需考察一下这些模型由关于记忆获得与失去的经验材料检验的方式。通常会作出这样的假定,即如果某被试被告知(例如)警察已逮捕了一嬉皮士,那么他就会(以一定的概率)记住警察已逮捕了嬉皮士。这个假定被认为表达了法则学上的普遍原则——它抓住了关于认知系统起作用的方式的某种似规则的东西。因此即使记住了警察逮捕了嬉皮士的那类人在心理学上的一切方面都彼此不同,但该理论仍会把他们看作是心理学上的自然类别。第三,在利用了语义网络模型的任何记忆搜索或推理任务中,追问哪一些命题被激活了、哪一些没有被激活是有意义的。因此在图1的网络中,如果没有激活猫有爪子这样的命题,那么搜索可能要终止。
Ⅳ.联结主义假说的家族
在前一节,我们主要阐述了:常识心理学承诺了命题模块性,而认知心理学文献所倡导的许多记忆模型可与这一假定和平共处。在本节中,我们打算描述一类联结主义模型,我们要论证的是,它们并不乐意与命题模块性和平共处。我们所想到的联结主义模型具有三种属性:
(1)在联结权数和对单元的偏倚中,它们的信息编码是广泛分布的,而非局部主义的;
(2)网络中的个别隐匿单元没有适当的符号解释;用P.斯莫伦斯基的术语说,它们是亚符号性的(subsymbolic);
(3)那些模型像认知模型一样是有意图的,而不仅仅是认知模型的补充。
在本节稍后,我们再对这三个特征作进一步的阐述,在下一节,我们将描述一个简单的、符合我们三个标准的联结主义实例。不过,我们不奢望,我们所说的足以为我们所考虑的那类联结主义模型提供锋芒毕露的描述。这种有锋芒的描述对我们的论证是没有必要的。如果我们能使你相信:存在着一类有意义的联结主义模型,它们与民众心理学的命题模块性是不相容的,那就足够了。
在进一步说明我们所列举的三个特征之前,我们先对我们称之为“联结主义的”那类模型作个一般性的描述,然后介绍属于该领域的某种专门术语。为此,我们不妨花一定的篇幅援引P.斯莫伦斯基的明晰的观点:
联结主义模型是简单、并行的计算元件的巨大网络,这些元件的每一个都携带着数字激活值,而该值是它用某种更简单的数字计算从网络的其他相邻元件中计算出来的。网络元件或单元通过携带着数值强度或权数的联结相互影响各自的值……
在一典型的……模型中,对系统的输入是通过在网络的输入单元上增加激活值而实现的;这些数值表达了输入的某种编码或表征。对输入单元的激活与联结一同扩散,直至某组激活值出现在输出单元上;这些激活值编码在系统根据输入推算出来的输出中。在输入和输出单元之间,可能还有其他单元,常被称之为隐藏的单元,它们不介入对输入和输出的表征。
在把活动的输入模式输送到输出模式的过程中,网络所完成的计算依赖于联结强度的集合;这些权数通常被看作是对那个系统的知识的编码(着重号为原文所加)。在这个意义上,联结强度在普通计算机中起着程序的作用。联结主义方案的主要魅力在于许多联结主义网络自我编制程序,即是说,它们有调节它们的权数的自动程序,因而最终能执行某种指定的计算。这种学习程序常常依赖于训练,正是在训练中,网络从它设定要计算的函数中得到了输入/输出的样本。在具有隐藏单元的学习网络中,该网络本身“决定了”那隐藏的单元将执行什么计算;因为这些单元既不表征输入,又不表征输出,它们从不被“告知”什么是它们应是的值,即使在训练期也是如此。(1988,1)
对斯莫伦斯基的描述必须作一点补充。在许多联结主义模型中,隐藏单元和输出单元被安排了一个数值“偏差”,它被加进了决定单元激活水平的计算中。一般而言,这种网络的学习程序确定了联结强度和偏差。因此,在这些网络中,那个系统的知识通常被当作是编码在联结强度和偏差中的。
一般性的说明就到此为止。下面让我们解释刻画了那些联结主义模型、而我们认为与命题模块性不相容的三个特征。
1.在许多非联结主义的认知模型中,如第3节末尾所阐释的那一个,很容易确定那模型的功能上不同的、编码系统中被表征的每一命题或事态的作用。而且,根据福多和皮利辛(1988,57)的观点,“通常的(计算机)构造要求:对它能表征的每一事态必须有不同的符号表达式。”在某些联结主义模型中,一种类似的功能定位不仅对输入、输出单元是可能的,而且对隐藏的单元也是如此。例如在某些联结主义模型中,各种个别的单元或单元的小型集合体本身就是要表征环境的特定的属性或特征。当从这样一个单元到另一单元的联结强度确实很强时,这就可能被认为是那个系统关于下述命题的表征,这命题是,如果第一个特征出现了,那么第二个也是如此。不过,在许多联结主义网络中,把命题表征定位于输入层次之上,这是不可能的。即是说,系统不具有这样的特殊特征或状态,它们为自己提供直接的语义评估。当系统作为整体因为没有以其应然的方式表征世界而未能实现其目的时,这有时可能为联结主义模型的创立者带来真正的麻烦。如果这一点碰巧发生了,那么如斯莫伦斯基所注意到的,“要为没有出现的非幻觉表征定位就一定是不可能的。任何特殊的状态都是状态的更大因果系统的组成部分,一般来说,系统未能满足目的条件不可能是根源于特殊状态或状态的组成部分”(1988,15)。在这类联结主义网络中,不可能把特定命题或事态之表征限制在节、联结强度、偏差的范围内,当我们谈论信息编码在广泛分布而非局部主义的偏差、权数和隐藏的节中时,我们所想到的正是这类网络。
2.正如我们已注意到的那样,有这样一些联结主义模型,在其中的某些或所有单元都打算表征那系统的环境的特定属性或特征。这些单元可以看作是这里所说的属性或特征的模型符号。不过,在其权数和偏差是由学习的规则系统调节的模型中,任何单个的单元或单元的小型集合常不会以直接的方式表征环境的特定的特征。在下节中我们将看到,即使任何隐藏的单元、权数或偏差不能恰当地看作是符号,但认为这些网络集中地、整体地编码一组命题则常常是合理的。如果出现了这种情况,那么我们就会把那模型中所利用的表征策略称之为亚符号策略。一般来说(或许永远如此?),利用了亚符号表征策略的网络就将以广泛分布的方式编码信息。
3.我们所列举的第三个项目并不是联结主义模型本身的特征,而是关于那些模型应怎样予以解释的一种观点。在阐述此观点时,我们必须以关于理论或解释层次的概念为前提条件,尽管目前的文献对此讨论很多,但这个概念远不是清晰的范式。介绍关于解释层次的概念最有把握的方式也许是在与下述熟悉的功能主义命题的背景之下进行,这命题是:心理学理论类似于可在各种非常不同的计算机上执行的程序。如果人们接受了这个类比,那么就有必要进一步探讨:一特殊的联结主义模型是否要成为在心理学层面或在基本的中枢执行层面上的一个模型。因为它们明显相似于真正的中枢构造,即使在许多方面是局部地相似,因此把联结主义模型当作是执行心理加工的模型则是很诱人的。某些联结主义模型的构造者旗帜鲜明地承认了这一点。不过,如此看来,联结主义模型并不是心理学或认知模型,就像关于认知过程怎样在量子力学层面完成的说明不是心理学说明一样。联结主义模型的构造者能够利用且经常利用的一个非常不同的观点是:他们的模型位于心理学层面,而不在执行层面。如是解释,该模型与关于同一现象的其他心理学模型就是对立的。因此关于语词识别的联结主义模型就是取代关于语词识别的非联结主义模型的东西——而不仅仅是对非联结主义模型的一种可能的执行;关于记忆的联结主义理论常常是语义网络理论的劲敌,如此等等。对其理论持这种观点的联结主义者常常借助与其他科学的类比来阐述这样的观点。例如,斯莫伦斯基主张:联结主义模型取代了传统的认知模型(如语义网络),这极像量子力学取代经典力学。无论在哪种情况下,更新的理论对于更广泛的现象来说,是更深刻、更普遍、更准确的。但是在每种情况下,新的理论与旧的理论在同一的解释层面又是针锋相对的。如果一个正确,那么另一个就一定是错误的。
在本文中,就我们关心的而言,存在着这样一个方面,在那里,可以认为联结主义模型与量子力学之间的类比回避了一个重要问题。因为当量子力学被认为是比经典力学更好的理论时,就可能提出这样一个似乎合理的论点:从经典力学向量子力学的转化是一种本体论上保守的理论变革。无论如何,从本体论上来说,这场变革显然不是激进的。如果在本文中,我们的中心论题是正确的,那么联结主义模型与更传统的认知模型之间的关系更像关于热的热质理论与分子运动理论之间的关系。热质理论与分子运动理论处在同一的解释层面,即使从本体论上来看,从一个向另一个的转变显然是相当激进的。为了证明热质的类比是更恰当的类比,那么描述一种具体的、即使是很简单的、能符合我们一直试图说明的三个标准的联结主义记忆模型,将是大有助益的。
Ⅴ.关于记忆的联结主义模型
在建构这种模型时,我们的目的是建立一种联结主义网络,它至少能承担关于记忆的更传统的认知模型所承担的某些任务,而且能清清楚楚地完成前一节所描述的那种分布式的、亚符号的编码。首先,我们建构一个网络,并称之为网络A,它能判断图3(底)横线之上所列举的16个命题之真假。该网络是一典型的三等线划分送进网络,由16个输入单元、4个隐蔽单元、一个输出单元所构成,如图4所示。每个命题的输入编码见图3的中柱。输出接近1便认作真,接近0便被认作假。反向传播[2]是一众所周知的联结主义学习规则系统,常用来“训练”那个网络,借以建立联结权数和偏差。当那网络对每一真命题始终如一地给予0.9以上的输出、对每一假命题给予低于0.1的输出时,训练便告结束。图5表明:在受过训练的网络中,联结权数位于输入单元和最左边的隐藏单元之间,与那单元的偏差存在一起。图6说明:联结权数和偏差仍在上游。图7表明:当“狗有软毛”这一命题在输入单元中被编码时,该网络用哪一种方式来计算对那命题的反应。
显然有这样的意思,即受过训练的网络A可以说储存着关于命题1-16的真或假的信息,因为当这些命题的随便哪一个显现给网络时,它就能正确地判断那命题是真还是假。在这方面,它相
图3
图4
图7
似于能完成相同任务的各种语义网络模型。不过,在网络A和语义网络模型之间也存在着一个鲜明的差异,如图1所表明的那种差异。因为正如我们先前所强调的,在语义网络中,存在着一种功能上不同的、与每一命题有联系的子部分,因此对于那网络的任何探测器来说,它就完全有理由询问:一个指定命题的表征是否起着因果作用。相比较而言,在联结主义网络中,就没有用来表征任何特殊命题的不同的网络状态或部分。在网络A中被编码的信息整体地储存着,并分布在整个网络中。每当信息从网络A中提取出来,通过给它一个输入串,看它为输出单元是算出一个高值还是一个低值,这样许多联结强度、许多偏差、许多隐蔽的单元就可在计算中发挥作用。任何特殊的权数或单元或偏差都有助于编码关于许多不同的命题的信息。如果问特殊命题之表征在网络的计算中有无因果作用,那显然是没有意义的。正是在这一方面,我们的联结主义记忆模型与常识心理学的命题模块性似乎是格格不入的。因为正如我们在第2-3节中所看到的那样,常识心理学似乎预先假定:对特定信念或记忆在特定的认知进程中是否起着因果作用这一问题一般有某种答案。但是如果信念和记忆由像我们的网络那样的联结主义网络来实现,那么这样的问题似乎就没有明确的意义。如果我们对网络A与我们在图8和9中所描述的第二种网络即所谓的网络B作一比较,那么命题模块性与我们的联结主义模型之间的不相容性将变得更加明朗。网络B正像第一个网络一样,是受过训练的,所不同的是有一附加命题加在训练装置之上(像图3横线之下所说明的那样被编码)。这一来,网络B编码了所有相同的命题,就像再加了一个命题的网络A一样。在语义网络模型和别的传统认知模型中,要说出系统的哪一状态或特征编码了附加命题,这是一件轻而易举的事情。而且要确定附加命题的表征在该系统所模仿的特定过程中是否有作用,这也是一个简单的任务。但是在联结主义网络中,这些问题显然是没有什么意义的。这不是说两种网络之间没有差异;情形恰恰相反;差异很多且很广泛。但是这些差异并不以整体的方式与民众心理学及更传统的认知模型所假定的功能上具体、语义上可解释的状态相关联。既然信息以高度分布的方式被编码,与包含着对许多命题都很突出的信息的每一联结权数和偏差相关联,既然关于任何特定命题的信息分布在整个网络中,因此该系统就没有功能上不同的、可以加以区分的、可从语义上解释为关于个别命题的表征的子结构。
图9
对网络A和网络B的比较能够使我们以不同的方式对常识心理学与这些类型的联结主义模型之间的不相容性作出我们的判断。在第2节中,我们已注意到,常识心理学把表达了命题态度语义属性的谓项当作可投射的。因此在常识心理学中,“相信狗有软毛”或“记得狗有软毛”就将是可投射的谓项。网络A和B大概可作为相信狗有软毛的认知代理人的模型;两个网络都储存或表征了关于狗有软毛的信息。这绝不是仅有的两个。如果我们用图3的17个命题连同增加的一些(或减去一些)命题去训练一个网络,那么我们就又得到了一个系统,它不同于网络A和B,就像A与B相互有别一样。这里的启示是:即使有无穷无尽的联结主义模型,它们像网络A那样表征了狗有软毛这样的信息,但这些网络也没有共同的、能用联结主义理论的术语描述的可投射特征。根据联结主义模型创立者的观点,可模拟相信狗有软毛的认知代理人的那类网络,并非地道的类别,而完全是一种混沌无序的分离装置。常识心理学把那类相信狗有软毛的人作为心理学上的自然类别;而联结主义心理学则不然。
Ⅵ.驳难与答复
我们在前几节所作的论证已碰到了许多驳难。在本节中,我们将重构其中最令人感兴趣的驳难,并陈述我们的答复。
驳难1:模型A和B并不是关于人类信念或命题记忆的严肃的模型。
诚然,我们所建构的模型是一些为着以一种显而易见的方式说明第3节中所陈述的特征而制作的小玩艺儿。它们无意于模拟人类命题记忆的任何根本方面。但是人们已基于各种理由,提出了这样的怀疑,即诸如此类的模型能否被严肃地当作命题记忆的心理学模型。某些批评者断言:这些模型绝不会按比例增加——因为一网络识别15或20个命题可能易如反掌,而训练一网络去识别数千个命题则是不可能的,更不用说数万个命题。还有一些人指责说:更传统的记忆模型,包括以似句子存储为基础的模型、运用了语义网络的模型、以产生式系统为基础的模型,都能为推理或泛化提供某种战略,这种推理或泛化能使那个系统回答关于它未明确被教过的命题的问题,而我们所构想的那些模型则不能推理和泛化。还有人论证说:这些模型作为对人类记忆的说明已惨遭失败,因为它们没有提供明显的方法去说明这样的事实,即作好了适当准备的人能轻而易举地得到一个命题同时所具有的命题信息。在通常的条件下,我们可以告诉亨利:汽车钥匙在冷藏室里,接着他就能在其记忆中可靠地记录下这个事实。他用不着诸如大量的再训练之类的东西,而再训练是把一个新命题教给我们的一个联结主义网络所必不可少的。
答复:如果这是一篇旨在为联结主义的命题记忆模型作辩护的论文,那么我们就必须对这些所谓的缺陷的每一个作出细致的处理。无论从哪方面说,至少可以为联结主义说点什么。例如,可以说下述观点是错误的,即A和B这样的网络没有泛化到该网络被训练过的命题之外。比如说在网络A中,训练安排就包括:(www.xing528.com)
狗有软毛。猫有软毛。
狗有爪子。猫有爪子。
狗有蚤。猫有蚤。
还包括:狗有腿,
但不包括:猫有腿。
不过,当该网络被给予了关于最后一个命题的编码时,它能正确地加以泛化,并肯定地作出反应。同样,该网络会对下述编码作出否定的反应:猫有重量。即使这个命题先前没有显示给它。
然而,考虑到我们在本文中所辩护的论点,对说我们的网络是关于命题记忆的不恰当的模型的这类指控逐个地作出回答就是多余的,认识到这一点极为重要。因为我们试图建立的是一种条件命题:如果我们在第3节中所描述的那类联结主义记忆模型是正确的,那么命题态度心理学便陷入了可怕的困境。既然包含有假前件的条件句是真的,那么我们便是因错而胜,如果我们的条件句的前件真的是虚假的话。
驳难2a:我们的模型其实并没有违反命题模块性原则,因为那系统所学到的命题是以功能上具体的方式编码的,即使这也许不明显。
我们早有耳闻,这一驳难是按三条不同的路线而阐发的。第一条路线——让我们称之为驳难2a——特别提到:功能上具体的编码也许常常很难被注意到,因此在因果检查中可能无望被看到。例如,试考察句子储存在典型的冯·诺伊曼式的计算机的记忆中的方式——具体地说,我们可以设想:当那计算机正运行语词加工程序时,那些句子便成了一篇英文文章的部分,并被储存起来。句子的部分可以以复杂的方式储存在物理上分散的、连在一起的记忆址中,即使对所有有关记忆址的内容能作出说明,人们也很难说一个特定的句子储存在哪里。但尽管如此,每个句子是以功能上具体的方式储存的。因此如果人们对那系统了如指掌,那么就有可能因窜改相应记忆址中的内容而删去正在储存的任何特定句子,同时使那系统正储存的其他句子成为不可企及的。同样,还有人主张:联结主义网络事实上可以以功能上具体的方式编码命题,即使在对受训练网络的偏差和联结强度的因果检查中,这一点也许不明显。
答复2a:要对付这一驳难的确有点困难。因为批评者所主张的是:在像我们所建构的那些模型中,可能存在着某种隐蔽的、有待发现的、功能上具体的命题编码系统。在回答这一点时,我们必须承认:可能的确如此。我们确实还没有这样的论据,它甚至能证明:发现这种隐蔽的、功能上具体的编码是不可能的。而且我们还承认:如果这种隐蔽的系统被发现了,那么我们论证的基础将受到严重的瓦解。不过,我们倾向于认为:摆在批评者面前的论证重任就是去说明:这种系统不仅是可能的,而且是很有希望的;如果没有任何严肃的理由,而又偏要说,我们的网络是以功能上具体的方式编码命题,那么“它们可能怎样”这样的纯逻辑可能性对我们几乎不是什么严重的威胁。
驳难2的第二种变种——我们将称之为驳难2b——为A、B之类的网络可能以之具体地、即使是隐蔽地编码命题的方式提出了一个明确的建议。据说,当一特定的命题呈现给那网络时,那种编码在隐蔽的结节激活模式中应是找得到的。既然我们的网络中有四个隐藏的结节,那么关于任何特定输入呈现的激活模式就可以表现为一个有序的4-元组。例如当网络A被提供了狗有软毛这样的被编码命题时,如图7所示:相关的4-元组就是(21,75,73,12)。同样地,我们可以把每一激活模式看作是四维非欧几何空间中的一个点。既然每个命题对应于那多维空间中的一个点,那么那个点就可视之为命题的编码。而且,那个点表征了那个系统的功能上具体的状态。
答复2b:上述建议不过是说:那个系统关于命题p的一个编码之呈现的激活模式与信念p是同一的。但这个主张是极其不合理的。明白这一点的最好方法也许就是注意到:在常识心理学中,信念与命题记忆一般具有基本的持续性;而且它们是这样的东西,即哪怕是认知动因没有使用它们,但认知动因一般拥有它们中的许多成分。试看一个例子。大袋鼠是有袋目吗?多少年来你肯定相信:它们是有袋目,即使今天你很可能是第一次激活或使用你的信念。然而一种激活模式并不是网络的一种持续的状态;甚至它肯定不是网络的一种状态,除非那网络有作为输入的相关命题。而且有大量其他的信念,是你多少年来所持有的。但是假设网络可能有在长时期内绵延不绝的大量激活模式,这是没有意义的。在任何特定的时刻,一种网络充其量只表现一种激活模式。因此激活模式并不是能合理地等同于信念或它们的表征的东西。
驳难2c:在这个节骨眼上,许多批评者主张:持久的信念不可能同一于激活模式,后者是网络的一种过渡的状态,但可同一于产生激活模式的倾向。因此在网络B中,关于狗有软毛的信念不能等同于激活的多维空间中的一个选址,而可同一于这样的倾向,即当命题被呈现出来时网络最终要在那个选址停留的倾向。这种倾向状态是系统的一个持续的状态;网络能进入的就是这种状态,不管其现在的激活状态是什么,正像糖块在水中有溶化的倾向一样,尽管附近并没有水。某些人还进一步设想:在作为倾向的信念和已发生的信念之间的那种流行的哲学区分,在联结主义网络中是可以予以反映的,就像产生激活模式的倾向与激活模式本身的区分那样。
答复2c:我们对这主张的答复是:即使产生激活模式的倾向真的是系统的持续状态,但它们并不是所需要的那类持续状态——它们不是民众心理学所需要的、具体的、因果上独立的能动状态。不要忘记,根据民众心理学关于信念和推理的概念,常存在各种各样相当不同的、基本的因果模式,它们可以导致特定信念的获取和认可。当克洛斯说男管家撒谎了时,他也许是利用火车出故障这样的长期信念作出这样的推理的;或者他还可能利用旅馆关门了这样的信念作出他的推论;或者两个长期信念都在他的那个推理中起作用。而且也有这样的可能,即克洛斯以前作出了这个推论,现在才来报告这个相对长久的信念。但难以弄明白的是:这类区分怎么可能为所谓的倾向说明所涵盖呢?在对一特定输入比如说p作出反应时,网络所接收的是特定的激活值。也许有接收关于别的输入如q和r的别的激活值的倾向。但没有明显的办法去解释这样的主张,即这些进一步的倾向在网络对p作出反应时起着作因果作用——或就那一点来说,它们没有起什么作用。我们不可能阐释这样的观点,即在一种情况下,q的编码(即火车出故障这一命题)起着一种作用,而r的编码(即旅馆关门了这一命题)并没有作用,在另一情况下,事情又是另一番景象。常识心理学预先假定的命题模块性要求的是:信念标记在某些认知阶段必须是功能上具体的、能相互发生因果作用的状态,而在另一些认知阶段则仍是因果上迟钝的状态。不过,在像网络A之类的的分布式的联结主义系统中,产生一种激活模式的倾向状态在功能上与产生另一模式的倾向状态是不可分割的。因此在某些认知过程中,就不可能把某些命题分离出来作为因果上能动的东西,而把另一些当作非能动的。我们的结论是:反应模式倾向不会作为信念标记而起作用。就我们所知,在像A和B这样的网络中,也不存在别的、能满足那种要求的状态。
Ⅶ.结论
在本文中,我们所辩护的论点是:某种类型的联结主义模型与常识心理学所包含的命题模块性是势不两立的。这里所讨论的联结主义模型就是这样的模型,它们在认知层面作为模型而被提供出来,在其中,信息编码是广泛分布的,且是亚符号式的。在这种模型中,我们要论证的是:不存在着具体的、语义上可解释的、只在某些认知阶段、不在别的阶段发挥因果作用的状态。因此,在这些模型中,不存在民众心理学的命题态度可以合理地与之同一的东西。如果这些模型最终为人类的信念和记忆提供了最好的说明,那么我们将面临着一场本体论上的激进的理论变革——这类理论变革将支持这样的结论,即命题态度像热质、燃素一样根本就不存在。
注释
①例如可参阅P.M.丘奇兰德(1981;1986),在那里,基于对类似于我们将讨论的那些认知模型之成功的反思,得出了明确的取消论结论。
②福多与皮利辛(1988)。
③我们知道,某些哲学家和科学史家实际上坚持类似于下述建议的观点,即前哥白尼宇宙学家所说的行星是不存在的。例如可参阅库恩(1962,第10章),费耶阿本德(1981,第4章)。不过,我们认为这个建议是不合理的。取消论的论证不可能那样易如反掌。关于这些问题的进一步讨论,可参阅库恩(1983)、P.基切尔(1978;1983)。
④关于科学还原的某种详细的讨论,参阅内格尔(1961),P.基切尔(1984)。遗传学的案例并非没有争议,参阅P.基切尔(1982;1984)。
⑤值得注意的是:对这一问题的诸判断在本质上是彼此有别的。一极是像费耶阿本德(1981)也许还有库恩这样的作者,对于他们来说,理论上相对小的差异足以证明这样的猜测,即存在着本体论上激进的变革。在另一极,有利康这样的作者,他写道:
我对倡导一种非常自由的观点可以说是费尽心机……我从心底里赞成放弃关于信念或愿望(或其他东西)的常识的或陈腐的理论,而且也赞成这样的判定,即我们在许多问题上是非常错误的,且不去推论说:我们再也不会谈论信念或愿望……我认为日常用语“信念”(民众心理学的理论术语)朦胧地指向了我们对之完全没有把握、有待于成熟的心理学去揭示的自然种类。我希望“信念”最终指称的是表现了有情识存在的内在状态的信息,……但是它指称的那类状态也许只有通常为常识赋予信念的一些属性。(1988a,31-32)
在我们看来,两种极端的观点都是不合理的。正如我们早就指出过的,哥白尼革命并未表明:托勒密所研究的行星是不存在的。但是拉瓦锡的化学革命也没有表明:燃素是不存在的。然而根据利康的“非常自由的观点”,闹不明白的是:我们为什么不应断言,燃素毕竟是真实存在的——它确实是一种氧气,在拉瓦锡之前,“我们在许多问题上是非常错误的。”
⑥常识心理学是一种理论,关于这种观点的较早的、且有影响的陈述,请看塞拉斯1956)。近来,该观点得到了P.M.丘奇兰德(1970;1979,第1、4章)和福多(1987,第1章)的辩护。至于对立的观点,可参阅威尔克斯(1978),马德尔(1986),夏普(1987)。
⑦请看斯蒂克(1983,237ff)。
⑧切尔尼克(1986,第3章)指出:这种无心性在文学作品和日常生活中很常见,有时会导致可怕的后果。
⑨关于句子模型,请看麦卡锡(1968;1980;1986),金特施(1974)。关于语义网络,请看奎利恩(1966),柯林斯和奎利恩(1972);拉梅尔哈特、林赛和诺曼(1972),安德森和鲍尔(1973),安德森(1976;1980,第4章)。关于产生式系统,请看纽厄尔与西蒙(1972),纽厄尔(1973),安德森(1983),霍兰等(1986)。
⑩关于可投射谓词与不可投射谓词之间的区分的经典讨论,请看古德曼(1965)。
例如,可参阅安德森和鲍尔(1973)。
布罗德本特(1985),拉梅尔哈特和麦克莱兰(1985),拉梅尔哈特、麦克莱兰与PDP研究组(1986,第4章),斯莫伦斯基(1988),福多与皮利辛(1988)。
这里所利用的程序概念对两种相当不同的解释是开放的。相关的读物,可参阅拉姆齐(1989)。
这种关于联结主义模型与常识心理学之间的不相容性的观点的阐述方式得益于福多的启发。
这个观点最先是由D.丹尼特提出的。
许多人倡导这种运动,例如G.科特雷尔和A.卡辛斯。
关于信念的常识概念,正如利康所述,即使人们睡着了,也还忘不了其中的大多数。
这类对我们的驳难是N.布洛克和F.杰克逊提出的。
参考文献
S.斯蒂克(1983):《从民众心理学到认知科学》,麻省理工学院出版社。J.福多(1983):《心灵的模块性》,麻省理工学院出版社。
A.柯林斯与M.奎利恩(1972):“关于语义记忆和语言理解的实验”,载L.格雷格编:《学习和记忆中的认知》,约纽:威利
P.斯莫伦斯基(1988):“论对待联结主义的正确态度”,《行为与脑科学》,11,1-74。
J.福多和Z.皮利辛(1988):“联结主义与认知结构:批评性分析”,《认知》,28,3-71。
P.M.丘奇兰德(1981):“取消唯物主义与命题态度”,《哲学杂志》,78,67-90。
——(1986):“认知神经生物学中的某些还原战略”,《心灵》,95,279-309。T.库恩(1962):《科学革命的结构》,芝加哥大学出版社。
P.费耶阿本德(1981):《哲学论文集》,第1卷,剑桥大学出版社。E.内格尔(1961):《科学的结构》,纽约:哈考特,布雷斯。
W.利康(1988):《判断与证明》,剑桥大学出版社。
K.威尔克斯(1978):《物理主义》,伦敦:劳特利奇与基根·保罗。
R.夏普(1987):“民众心理学的观念”,《探索》,30,381-393。
C.切尔尼克(1986):《最低限度的理性》,麻省理工学院出版社。
A.纽厄尔和H.西蒙(1972):《人类问题解决》,恩格尔伍德·克利弗斯,新泽西:普伦蒂斯·霍尔。
J.安德森(1983):《认知的结构》,哈佛大学出版社。
N.古德曼(965):《事实、虚构和预测》,印第安拉波利斯:博布斯-梅里尔。
D.布罗德本特(1985):《层次问题:评麦克莱兰和拉梅尔哈特》,《实验心理学杂志:一般观念》,114,189-192。
W.拉姆齐(1989):“平行论与功能主义”,《认知科学》,13,139-144。
【注释】
[1]选自斯蒂芬·p.斯蒂克:《解构心灵》,牛津大学出版社1996,第2章,本章是斯蒂克与拉姆齐、加龙合写的。
[2]back-Propagation,指通过在网络上逆向传送一个错误信息(即从产生单元开始)来训练神经网络的一种程序。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。