首页 百科知识 心灵哲学:联结主义与概论

心灵哲学:联结主义与概论

时间:2024-01-23 百科知识 版权反馈
【摘要】:哲学家们也开始注意联结主义。在本文中,我的目的就是想简要地介绍一下由联结主义所引发的某些哲学争论。在下一部分,我将进一步讨论联结主义模型怎样与神经模型相关联。一般来说,联结主义者常启用两种不同类型的说明图式。尽管大多数哲学家不会去从事联结主义网络的实际构想,但仍有一些关于它们的构想的基本哲学争论。②在联结主义纲领中,部分的作用无关紧要,系统的行为主要是起因于部分的相互作用,而不是部分本身的行为。

心灵哲学:联结主义与概论

联结主义与心灵哲学概论[1]

威廉·贝希特

联结主义近来引起了认知科学的极大关注,因为它似乎有望取代对于认知模型的传统的基于规则的研究方案。哲学家们也开始注意联结主义。在本文中,我的目的就是想简要地介绍一下由联结主义所引发的某些哲学争论。我不打算对联结主义本身作什么辩解,然而,如果我认为它不能对心灵和心理现象的理解作出某些重要的贡献,那么我也不负有如此之类的使命。更确切地说,我的目的就是引发进一步的讨论,并集中于此。因此在本文每一部分中,我将提出一个或更多的问题,并予以简要的讨论。在讨论这些问题时,我将指出我认为是发人深思的答案,不过这里我不想对它们作出肯定的论证。

认知的联结主义模型的基本特征

研究认知的联结主义方案除了探讨近几十年来引导对认知的大量思考的传统的计算机模型之外,首先要研究的就是作为认知基础的机制的特殊概念。这一替代模型的灵感来自于我们对大脑的理解。即使联结主义模型试图体现大脑结构的重要特征,但联结主义并未对中枢过程提供详尽的说明。确切地说,它倡导的是与认知有关的那类加工模型。在下一部分,我将进一步讨论联结主义模型怎样与神经模型相关联。在本部分,我只准备以联结主义者所用的那种方式抽象地说明联结主义模型。

联结主义结构的基本构成部分就是像神经元这样的简单单元,它们在任何特定的时候都被激活到某种程度。典型地说,这种激活就在于控制电荷。仍像神经元一样,这些单元与其他单元相联结(这些联结可能具有不定的强度),以便它们基于它们自己的激活促使其他单元激活的增加(兴奋)或减少(抑制)。此外,在某些联结主义系统中,这些联结的强度可能由于此系统中的活动而改变,以至于一个单元对另一单元的作用能随时改变。

即使这一概述涉及到联结主义系统的基本构成部分,但事实上,联结主义系统还可有许多不同的建构方法。基于一种方法,各种参数可以确定下来。一种参数决定了单元的可容许激活水平:这些单元可能被限制在少数分立状态(如开和关),或者它们也容许在特定的范围内变化(如从0到1)。另一种参数制约了一单元的激活怎样根据它的先前状态和它从其他单元接受的输入而发生变化,例如其中可能包括一种衰退的功能,在没有新的激活的情况下,一单元的激活就将中止,一种临界值可能被用到,因而除非输入超过一定的量,一单元就不会被激活。第三种参数规定了一特定单元的输出量。输出可能与它自己的激活成比例,或者说它可能为一临界值所限制。最后,有许多学习规则,它们可用来在特定的通路上调节联结的强度。其中两个最广泛地被采用的规则分别是赫布规则(Hebbian rule,它根据两个单元在它们的激活水平上是相同还是不同来加强或削弱通路)和δ规则(delta rule),它增强或减弱每一输入通路的力度,以便增加单元的目标值和电流值之间的协调。(关于联结主义系统各种可能构型的进一步详细说明,请参阅拉梅尔哈特等,1986)。

基本的加工系统就是这些被联结起来的单元的集合体。当一种激活的初始模式被给予这些单元中的一部分或全体时,这样的集合体就开始发挥作用。这种模式可以看作是给予那集合体的一个问题。当系统适应一种稳定状态(例如有一种状态,在那里,经过联结,激活的完成并不会导致单元改变它们的激活强度)时,加工就结束了。这种适应依据热力学原则而发生:单元由于它们的输入而改变它们的激活,从而改变它们的输出,直至该系统适应最高的熵的状态。当一种稳定模式得到了,总的稳定模式或关于某些单元的值便表征着系统对于那个问题的回答。

在建构像问题解决这样的系统时,我们应对系统的活动提供一种说明。一般来说,联结主义者常启用两种不同类型的说明图式。在局部化(Localized)说明图式中,每一单元表征的是某种对象或属性。例如在拉梅尔哈特和麦克莱兰的单词识别系统中,每一单元便表征着关于可能在场的特征、字母或单词的一种假定,单元的激活程度表征的是对于相应项目是部分输入的信任程度。

另一可供选择的说明图式是一种分布图式,在这里,一种说明被归结为一种对于整个单元的集合体的激活的模式。个体单元的活动本身可以有某种符号作用(例如表征被认知对象的特征)。但是具有首要利益的不是特定的特征,而正是整个模式。使这种方案特别令人感兴趣的是:同一个网络具有适应被给予了不同输入的不同激活模式的能力。当一种模式实现了,另一些模式在它们可能为相应的输入所激活的意义上,仅仅是潜在地出现了。人类要理解已开发的、运用了分布表征的系统中的活动,是相当困难的,但是存在着许多使这种系统具有极高吸引力的性质,例如相关表征激活常见单元的能力(这可理解为对由模式表征的整个对象的特征的表征)。(参阅欣顿等,1986)

尽管大多数哲学家不会去从事联结主义网络的实际构想,但仍有一些关于它们的构想的基本哲学争论。有一个就是关于这样一些原则的,它们控制着这些网络的操作,并且我们根据它们解释这些网络的诸能力。

1.有没有我们据以解释联结主义系统的行为的基本设计原则?或者说联结主义系统的行为仅只是突现的吗(在特殊的情形之下)?

有些理论家已预见到了这样的前景,即我们可以建构联结主义系统,它能模拟人类的认知行为,但不能以机械论的方式解释这种行为。机械论的解释方法在许多学科中广为流行。这些学科中的科学家试图解释复杂系统的行为,方法是把复杂系统分解为部分,然后说该系统的行为怎样来自于部分的行为。根据这种机械论观点,每一构成部分可视为对于整个系统的行为所作的一种具体贡献。在联结主义纲领中,部分的作用无关紧要,系统的行为主要是起因于部分的相互作用,而不是部分本身的行为。虽然有这样一些学科(如热力学),其中的解释模型已得到发展,在解释中,几乎没有什么解释功能被归之于部分,数学理论也发展到了这样的地步,因而能表明整体的行为怎样产生出高水平的结果,然而这些解释常常是不令人满意的。不过联结主义模型发展的潜在结果是:我们在心理学中可能有必要放弃机械论的分解方案,而接受数学和统计学关于突现的解释,这种突现出现在现象的更高水平之上,而不是从另外的低水平的操作中零碎地聚集起来的。

下面是关于研究者在解释联结主义系统时所用的原则的争论:

2.把认知的、意向的解释用于联结主义网络中的活动是建立在根本原则的基础上的吗?

一种可能性是:研究者们把一种认知的、意向的解释用于联结主义网络,仅仅是因为那个系统以容许它执行任务的方式行动,例如我们认为,一系统在识别一单词,因为如此被说明,它的行为才是适当的。这就是丹尼特(1978)关于意向描述怎样用之于包括我们自己在内的任何系统的观点,这就是体现了丹尼特的意向性说明的工具主义特征的东西。然而在许多人看来,这是一种令人极为不安的结果。对于他们来说,我们的心理状态真的是“关于”事物的,即是说它们具有塞尔(1980)所说的“内在意向性”,正是这一点才是我们的心理状态的根本特征。在联结主义系统中,如果状态的实际特征中没有任何支撑我们意向属性的东西,那么某些批评者就会认为:联结主义系统未能说明认知状态的基本特征。对于关于心理功能,如在传统的人工智能纲领中所把握的那种功能的传统计算解释,塞尔作出了同样的批评。但是至少是在福多(1975)关于计算理论的阐释中,程序的句法操作据说反映了语义学,因而状态的内在加工被认为反映了从语义学上加以解释的推理的种类,而我们却认为那些推理是那个系统作出的(例如,如果因为有闪电,系统就推论:将要打雷,那么内在过程就将包括这样一种推论,即从我们认作命题——“有闪电”的符号到“将要打雷”的命题的推理)。联结主义者拒绝这种句子加工模型,因而对于我们给予系统的一切语义学说明似乎不可能提供动机明确的解释。

即使有另一种观点,据此我们可以判断:对于意向性,联结主义系统实际上是比传统的认知模型更好的精神食粮。但德雷福斯(1979)对传统人工智能纲领提出的反对意见之一就是:它们试图明确表征那种系统会用到的全部信息。这种企图除了潜在地使人工智能努力不可能实现外,还可以解释这种系统为什么缺乏内在的意向性。该系统的行为完全由其内在表征所决定,因此它不可能直接与这些表征打算“关于”的外部对象相关联。然而一种联结主义系统并不依赖于作为它的加工单元的内在表征。它产生作为对输入作出反应的内部表征,同时也有开发这样的系统的可能,这些系统能调节它们的联结力度,进而产生它们自己的、把输入范畴化的系统(参阅拉梅尔哈特等,1985)。而且为了实现它的认知操作,它也不需要表征它的环境的一切有关方面。它完全能以适当的方式对环境的那些特征作出反应。使自己与环境相协调,而且不完全根据按句法规则编码的表征进行操作,这两者的结合使人们更有理由认为,联结主义系统的活动真的能“关于”它们环境中的事物,因而享有比传统认知模型更内在的意向性。不过这只是简述了一种方法,以此我们可以推进对联结主义系统的意向解释。当然,对这种系统中的意向性作出解释的潜力还需进一步探讨(参阅贝希特尔,1985a)。

认知的联结主义说明与以规则为基础的说明之比较

联结主义方案的倡导者常常把联结主义说成是对于解释认知的更传统的方案的一种可供选择的东西、一种潜在的替换品。传统方案设想:认知系统按照规则处理表征。如果联结主义真的是一种替代性的选择,如果我们能明确地阐明两种方案如何不同,那将是大有裨益的。

由于乔姆斯基语言的说明(据此,语言中的专门结构可能是由规则的递归集合应用于其他语言结构而产生的)以及在数字计算机上模拟认知的尝试,关于认知的规则和表征模型就变成了一种在认知科学中占有显著地位的模型。对于模拟人类认知行为的计算机的应用极为重要的是这样的假定:心灵和计算机就是纽厄尔(1980)称之为“物理符号系统”的东西。这就是说,符号从物理上编码在能够按照指定规则被操作的数据结构中。当这些规则能直接地具体化于系统的物理过程中(像它们在袖珍计算机中那样)时,它们一般会把自己编码在数据结构中,以至于在一数据结构中的某些因素控制了其他组成部分的操作。

围绕联结主义模型怎样区别于以规则为基础的模型,产生了一个基本问题。既然表征以及操纵它们的规则是以规则为基础的说明中的关键因素,那么就让我们考察一下联结主义模型中是否有它们的类似物。从表面上看,联结主义系统似乎极不同于以规则为基础的系统。在前者中根本就没有操作作用于其上的固定表征,而只有被激活的单元,它们进行活动以增加或减少其他单元的激活,直至稳定的构型得以形成。然而外表可能是骗人的。表面的差异可能是我们对于两个系统所作的排列或分析的产物。在联结主义系统中,我们是在单个集合体中考察活动,我们看到的这种集合体通常所执行的任务是基本的认知操作(例如识别和分辨一特定输入)。但是联结主义系统要模拟令人感兴趣的认知活动将需要运用大量的集合体,而且利用一些集合体储存其他集合体的内容或控制其他集合体的加工也可能是必要的。当我们考察大量的集合体可能由以履行重大的认知任务的方式时,我们便可以看到:把那活动看作是以规则为基础的表征加工是再自然也不过的了。

为了弄清联结主义模型与以规则为基础的模型之间的差异,如果有这种差异的话,我们就有必要小心注意表征和对它们进行加工的规则这两个概念。先看表征,我们可以提出这样的问题:

3.联结主义系统所用的表征不同于基于规则的系统所用的表征吗?

福多和皮利辛(1988)在批评联结主义时指出:既然联结主义者不是(在局部主义解释中)对单元就是(在分布的解释中)对激活模式提供了语义解释,那么他们就是表征主义者。这足以使两个系统中所用的表征相等同吗?其实仍存在着可观察到的某些差异。在对联结主义系统的局部化说明中,被赋予了表征功能的单元常常出现,但它们是由那系统中的其他活动开或关的。这不同于表征在以规则为基础的系统中被操作的方式。但不清楚的是:这种差别究竟有多重要。就分布系统来说,它就是一种超出作为表征的单元的集合体的模式,因此在那里可能存在着更大的差别。在这样的系统中,当一种模式不出现于该系统中时,它就不被储存,就像在传统认知模型中那样。这种模式不能从记忆中检索出来,但可在适当条件下被重构。这里仍有差异,当然仅只是执行任务方面的,从而不至于引起两类系统之间的根本差别。更基本的问题是:联结主义系统中的表征是否能像以规则为基础的系统中的表征那样完成相同的基本功能。这是一种莫衷一是的争论。这里我只能摆出来,而不打算给予回答。

当我们集中注意控制两类系统中的操作原则时,对它们作出比较可能是大有希望的。以规则为基础的系统通过专门把规则直接关联于对表征的处理而发生作用,而联结主义理论家的一个远大目标就是想搞清楚:我们是否可以通过让全部活动由决定激活怎样在单元之间进行的联结来控制这一方式去摆脱规则。但这又促使我们考察下述问题:

4.控制基于规则的系统的加工规则与控制联结主义系统的加工的各种联结之间有什么明显的差别(如果有的话)?联结是规则的功能等价物吗?

在一定意义上,联结具有与规则相同的功能:它们都可使系统从一种表征状态过渡到另一种表征状态。联结和规则之间的关系更清楚地体现在所谓的“可编制程序的联结系统”中,在此系统中,一种单元集合体的活动把联结固定在另一集合体中,从而决定它的加工能力(麦克莱兰,1986)。再者,明确对两类系统作出区分这一问题是颇令人困惑的,我这里不能予以解决。

试图把联结主义系统与以规则为基础的系统区别开来,由于下述事实而很难实现,这事实是:通常的联结主义系统不是直接用硬件建造的。确切地说,它们是由传统的计算机模拟的,在这里,程序(由规则陈述所构成)被编写出来,目的是要决定联结主义系统怎样行动,因而我们必须进一步提出这样的问题:

5.用以规则为基础的冯·诺伊曼计算机模拟联结主义系统,能说明联结主义系统与以规则为基础的系统之间有基本的相似性吗?

问题似乎相当棘手。有些已接受了关于认知的以规则为基础的模型的人坚持认为:如果我们为一计算机编制这样的程序,让它像人类一样进行符号处理,那么我们就创造了一真正的能思的实在。在传统计算机上所作的对联结主义系统的模拟中,计算机计算那控制一联结系统中的单元激活的变化的诸方程式,进而确定什么是联结主义系统中的所有单元的激活强度。如果传统计算机能模拟联结主义系统,那么我们怎么能坚持认为两者是根本不同的呢?

然而这种消解联结主义系统与以规则为基础的系统之间差别的方法似乎是不恰当的,在以规则为基础的计算机上所作的联结主义机器模拟可与计算机上的飓风模拟相比拟。在两种情形之下,计算机所作的就是决定什么是因果过程的结果,此过程实际上是未经过那些因果操作而发生的。根据这种观点,模拟了联结主义系统的以规则为基础的计算机并未例示联结主义系统的重要因果属性,而只是向我们说明了那系统中的因果相互作用的结果。

关于认知的联结主义方案与以规则为基础的方案之间的冲突

在回答上述问题3和4时,即使我们在联结主义系统与以规则为基础的系统之间作出区分这一点尚不明朗,但每类系统的倡导者为了他们那类模型的利益,对他们所信奉和论证的那类系统提出了相对清楚的范例。让我们假定两类系统是根本不同的,并转向下述问题:

6.我们用什么标准来评判联结主义说明或以规则为基础的说明是否给予人类认知过程以恰当的说明呢?

如果有这样的认知任务,人类能够予以完成,而那两类系统中只有一类能完成,而另一类则不能如此,那么上述工作实属举手之劳。进而我们也就有相当充分的理由偏爱能完成人类所完成的任务的系统。许多以规则为基础的理论家对联结主义模型的初步回答就是主张:这其实是自然形成的状况。他们认为:存在着像递归这样的过程,人类能完成,而联结主义系统则不能完成,因而联结主义系统是不妥当的(福多和皮利辛,1980,平克尔和普林斯,1988,他们提出了这类反对意见)。

不可能有这样的结果,即一方想以此为基础表明:他们的系统能做另一种系统不能做的事情。以规则为基础的模型与网络-类型的模型之间的这类争论有一先于联结主义流行的历史。第一代联结主义模型类型(如塞尔弗里奇(1955)和罗森布拉特(1962)的网络模型)已被摈除,因为很显然它们对后来所考虑的那些类型的模型构成了限制。明斯基和帕波特(明斯基和帕波特,1969)已建立了说明这种限制的某些重要原则。然而时下的联结主义者一直想说明这些限制怎样才能被克服(拉梅尔哈特和麦克莱兰,1986)。70年代初,认知心理学中对于类型上有点不同的网状模型、语义网络(参阅奎兰,1968)和作为表征概念的工具的特征定向(feature set)模型的相对优点曾有过争论。史密斯(史密斯,1974)等人论证说:他们的特征定向模型有把它与网络模型区别开来的属性。而霍兰(霍兰,1975)则对这种区分提出了挑战,方法是说明史密斯等人的模型怎样相同于网络模型。里普斯(里普斯,1975)等人基本上接受了霍兰的主张,但对于区别又提出了不同的观点,后面我再讨论这种区别。在这点上,假定联结主义模型能完成的任何任务也能被以规则为基础的模型所完成,反之亦然,这似乎是合理的。

里普斯等人提出的、关于区分的替代观点就是主张:“选择一种而不是另一种表征可能导致理论之间的真实加工的差别,即使表征本身在某种水平上是同型的”(p.156)。这一看法也适用于对于联结主义的常见争论。即使联结主义模型和以规则为基础的模型中的每一个都能重复另一个的全部行为,但它们在完成任务的方式方面则彼此不同。这些差别可以表明:哪一类模型可以提供一种关于人类认知的更好的模拟。当许多联结主义者论证说:他们的模型运作的方式比传统的以规则为基础的模型更相像于人类,他们所倡导的事实上就是这样的方案。

例如联结主义者论证说:他们的模型在生物学上比以规则为基础的模型更现实。例如它们表现出有被称之为100步原则的迹象(费尔德曼和巴拉德,1982)。基于个体的神经过程大约只花几毫秒,许多基本的认知任务在几百毫秒内便可完成,他们便推论说:心/脑经历的不过约100个连续的步骤。而当代大多数完成这些任务的人工智能程序则需比100步多得多的步骤,但联结主义机器能在100步之内成功地给出答案。

联结主义者还提到了联结主义系统的一些行为特征,他们认为,这些特征体现了联结主义关于人类认知的模型的优越性。例如能够对变形输入或新的输入作出反应就是联结主义系统的、与模型识别有关的一个自然特征,因为这些输入明显不同于那些预先为它设定的输入,或不像它曾被训练对之作出反应的输入。它还会对已改变了的输入作出反应,就像它对它的先前的、最直接地与之对应的输入作出反应一样,即使是在没有特别地告诉它怎样对付这种新输入的情况下,它也将如此行动。而且当联结主义系统的部件被破坏或当它超负荷时,它的运行会平稳降级。例如如果联结主义系统的某些单元遭到破坏,那么该系统仍可以通过大体进入并适应相同的稳定状态而对输入作出反应。

然而,就此而言,联结主义论证可能碰到下述主张所碰到的困难,这个主张认为:一类系统能完成另一类系统不能完成的任务。以规则为基础的加工模型的倡导者能满足生物学和加工这两方面的条件。例如以规则为基础的人工智能模型似乎违背了加之于大量加工步骤上的生物学约束,其中的一个理由就是:这些模型是为连续加工的计算机设计的。但当代许多认知理论(例如安德森的ACT*模型)用的是产生式系统设计,而产生式系统自然是用平行结构完成的。这样做将戏剧性地减少许多连续的步骤,这些步骤对认知过程的以规则为基础的模拟似乎是必不可少的。而且A.纽厄尔(1987)在采用一种以规则为基础的方案时,也求助于加工时间补偿,他用了关于加工时间的信息,作为通向结构的符号的向导,并坚持认为:他为关于认知的统一理论(SOAR)所提供的候选结构与关于心理过程的时间限制数据是相吻合的。

以规则为基础的加工的倡导者也能接受为了联结主义模型的利益而改进的加工数据。已经出现了以规则为基础的范畴化模型,它们可处理变形的或不完善的输入。这些系统可接受具有不同特征的信息,并可运用这样的算法,即它们能以那些信息为基础来确定那对象最有可能存在于什么范畴中。为了设计能自然降级的、以规则为基础的系统,安排部分冗余度对于这种系统所用的加工程序来说将是必要的。但从根本上说,这与以规则为基础的模型的观念不是不协调的。

关于两类系统能做什么的行为数据或关于它们的执行方式可能是什么的行为数据,对于回答问题6是不够的。唯一的补救办法似乎是找到决定人类心灵怎样起作用的某种直接方式。在以规则为基础的加工方案之内,像皮利辛(1984)这样的理论家已论证过:为了使认知模拟比照人类,我们必须考察心灵的基本构造。他主张,只有根据关于这种构造的知识,我们才能够确定这种模拟是否完成了同样一组操作。如果有一种辨别这种构造的方法,那么我们就可能确定人类心灵的基本操作是联结主义系统的操作还是以规则为基础的系统的操作。

我们应怎样认识人类心灵的构造呢?皮利辛所提供的识别构造的标准(对于不同任务和认知渗透性的相对的反作用时间)是行为方面的,并碰到了这样的难题,即我们可以用一种构造模拟另一种构造的行为,正像我们能在计算机中把一种构造编译或解释为另一种构造一样。而且他的认知渗透性标准可能已引入了一种有利于寻找一种有规则的加工系统的偏见,因为他似乎集中在信息的命题类型的渗透性上。(www.xing528.com)

究竟是联结主义者还是以规则为基础的理论家对我们的认知结构提出了正确的解释呢?如果作出决断变得如此困难,那么他们之间的冲突似乎就不会像过去那样使许多人感兴趣了。首先,联结主义似乎已经提供了一种以规则为基础的加工解释的真实的对比,但我在本部分和前一部分所主张的则是:两种解释之间的差异可能是很难辨别的。不过也许我用了错误的方式去看待这种冲突。我一直把它当作是竞争的理论假说之间的冲突,我要搞清楚的是;我们怎样判断哪一个是正确的。探讨该问题的一种更富有成效的潜在的方法就是把它看作是建构认知模型的两套不同类型的工具之间的冲突。因此两种方案之间存在着根本的不同。不同的任务执行起来或易或难,这主要取决于我们采用哪一类系统。如果我们采用以规则为基础的模型,那么古典的推理任务就很容易形成模型,因为大多数推理模型是从逻辑的工作中派生出来的,因而是以规则为基础的。另一方面,也有相当不同的任务类型,诸如模式识别,它们似乎更容易在联结主义框架中处理。

这里要说明的是:我们应当思考冲突,不是关于哪一种模型提供了关于人类认知系统的正确解释,而是去问哪一种提供了发展认知理论的更有用的框架。这样我们就把这种冲突变成了一种关于理论发展战略的冲突,进而我们便可以提出下面的新问题:

7.在联结主义框架与规则-加工框架内,发展认知理论的相对优点是什么?

从这种观点来看,在特定类型的系统中什么易于模拟这一问题格外突出,而我们能在对立类型的系统中完成许多相同的加工这一事实则无足轻重。在特定类型的系统中,一类操作很容易完成,这一事实可能促使用了那种系统的人比那些难以在他们的系统中加以实现的人更加注意那种认知操作。根据这种观点,联结主义模型的广泛引入堪称认知科学中真正重要的事件,因为它可以引导我们注意不同类型的认知现象。尤其是可以引导我们超出语言加工和推理任务(它们似乎适合于以规则为基础的模型处理)进到其他认知活动,如模式识别,而这些活动在以规则为基础的模型中已证明是极难处理的。顺着这种方案,让我们考察一下模式识别,因为它已成为联结主义者研究的典型任务。

模式识别在人类认知中的重要性

联结主义系统之进入不同的稳定状态取决于它所接收到的输入,这一点自然使人们认为这种系统可完成模式识别或范畴化。既然能改变它们联结强度的系统也可改变它们对时间的反应模式,因此认为这些系统可学会对输入的分类就是顺理成章的。相应地,研究者一直在探讨这种系统的不同学习程序,因而联结主义系统就被设计出来了,它们学习把输入模式范畴化,在学会之后,就以与先前学到的模式的相似性为基础,把新的输入加以范畴化。(联结主义者在说以相似性为基础作出判断时,自然不是说联结主义系统能确定客观的相似性,能解决哲学文献中一直在讨论的关于相似性的各种难题。这些系统所作的相似性判断,是由该系统的联结强度所决定的。我们有特许权说这些系统能判断相似性,是基于这样的事实,即它们把我们认为是相同的模式归于一类模式中。)正是由于它们能作出这样的相似性判断,联结主义系统才证明它们有把新输入加以泛化以及适当地对变形输入作出反应的能力。

在联结主义系统中轻而易举地完成模式识别的任务这一点又提出了一个饶有兴味的问题:

8.模式识别究竟是何等重要的认知任务?

认知科学研究者一直有这样一种普遍的看法,即模式识别是一种重要而又从属性的认知活动。模式识别在其中显得重要的一个条件就是按照机器观点去发挥作用,在这里艰巨的课题是让机器能通过感官输入识别对象。很明显,这是机器在它们能与世界上的事物相互作用之前要获得的技巧(如像智能机器人)。但建立具有良好模式识别能力的、以规则为基础的加工系统则是不容易的,这部分是因为这样的识别要求机器能处理大量的环境线索,而这些线索的关联又可能因环境而异。然而,既然我们在系统中从符号上将信息编码,进而直接集中在使用了那种信息的高水平加工上,因而对于许多目的来说忽略这一难题就是可能的。与识别感性输入的任务有关的能力给人以这样的印象,即模式识别可能仅只是从属的认知功能,在说到其他认知任务时,它可能被忽略。

然而,近年来,发表了关于概念和范畴化的相当多的心理学文献。范畴化是一可与模式识别相比拟的任务,因为它需要识别相同项目的能力,以便把它们归于一类。在以规则为基础的构架内,人们自然想到范畴化是由说明某东西必须具有什么特征才属于一类范畴的规则所决定的。心理学家罗施(1975)对这种观点提出了挑战,认为范畴有一原型结构:某些范例(如知更鸟)作为一种范畴(如鸟)的例子就比作为其他范畴(如鸭子)的例子更好一些。这说明范畴并不能根据充分必要条件而加以描述。罗施本人并未让这种原型理论归并到关于范畴怎样在心理上被表征的理论中。但其他心理学家这样做了。即使范畴原型理论之采用瓦解了下述观点的基础,这观点是:范畴以说明了充分必要条件的简单规则为基础,但大多数试图发展关于心理表征的说明以包容原型数据的心理学家仍坚持规则方案,根据这一方案,被试判断一对象相似于具有不同特征的原型,进而运用规则来决定那对象是否属于那类范畴(关于这种文献的评论,参阅史密斯等,1981)。有充分的理由认为:这种过程自然能由联结主义系统完成。正如我们已指出过的那样,判断相似性是联结主义模型的基本能力。联结主义模式识别方案根据与先前输入模式的最直接匹配,而不需要特别地约定的规则,就能划分新的输入模式的种类。所以罗施式的关于范畴化的原型理论大概已顺利地、自然而然地充实到联结主义系统中去了,并且避免了试图设计以规则为基础的范畴化加工所碰到的困难。

然而,对于那些赞美认知科学中以规则为基础的加工的人来说,范畴化任务像视觉任务一样似乎不是关键的(尽管我们怎样把事物范畴化这样的证据可以极大地影响我们怎样对它们进行思考和推论)。他们可能坚持认为:一当信息以严格的符号形式或密码被表征时,真正的认知工作才能开始。不过,我们一当把这些任务当作是模式识别任务时,我们也就可以看到模式识别怎样以更重要的认知加工出现。关于更高水平的认知活动如问题求解的最广泛地被接受的观点(一种由西蒙、纽厄尔和安德森等理论家奉献的观点)大概是这样的,即这些活动中的熟练行为依赖于获得适当的规则。而这些规则常被认为是以相当有意识的方式学到的,但随后就变成了自动的(无意识的),因而熟练的行动者一般能在没有明显的有意识思考的情况下运用它们。然而德雷福斯等人(1986)则论证说:这样的规则学习只会导致一定范围内的有效行为。他们坚持认为:专门行为依赖于能够识别很像以前某些情境的情境,以及以相同的方式对之所作出的反应。他们考察的例子之一就是下棋,亦即一种为接受以规则为基础的方案的理论家们经常研究的活动。德雷福斯等人主张:把专家与合格的棋手区别开来的东西不是附加的、以规则为基础的知识,而是非常发达的、识别当下情境怎样相似于以前碰到的情境的能力。如果他们是正确的,那么模式识别甚至可能出现在似乎是高水平的推理任务这样的事例中,这些任务以前似乎离不开以规则为基础的推理。假如在联结主义系统中完成模式识别与比较是轻而易举的话,那么这就表明:要弄清在不求助于以规则为基础的推理过程的情况下,模式识别究竟有多大作为,就必须开发联结主义系统的这种能力。

在本部分中,我的任务就是努力说明模式识别在其中可能是重要的认知能力的某些关系。还有其他一些领域,在那里,这种能力可能也是重要的。例如经过模式识别过程,联结主义系统可能激发与先前相似的经验有联系的模式。这提供了一种探讨模拟可寻址内容记忆的任务的富有启发性的方法。这是一种体现了人类特征的记忆方式,但很难在古典的结构中成功地加以模拟。我们也可以发现模式识别在下述活动中的作用,它们一直被当作是像句法加工这样的按照规则加工的范例。我们发现:只要使用模式识别系统,我们即使不求助于复杂的语言学规则也能设计出有助于语言理解和生成的系统。这些自然只是建议,对于联结主义系统借助不求助于规则的模式识别过程究竟能获得多大的成功,我们将拭目以待。还应记住:设计能完成相同模式识别任务的、以规则为基础的系统多半也将是可能的。在联结主义系统中完成这些任务是相对容易的,这一点说明:我们应开发这种系统以确定认知在多大程度上依赖于模式识别,而不需以规则为基础的加工。如果联结主义系统有助于引导我们注意像模式识别之类的、别的认知活动,它们不是最近的以规则为基础的认知科学关注的焦点,那么这些系统将会有重要的启发功能,不管关于人类是联结主义系统还是以规则为基础的系统的争论的最终结局是什么。

联结主义模型与

规则-表征-模型的可能调解

即使联结主义者和以规则为基础的理论家常把他们相互视之为敌对者,但我在最后一部分要强调的是:两种系统对许多不同类型的活动来说自然是各有千秋。既然推理常被看作是遵循规则,如像自然演绎系统中明确表达的那些规则,因而让以规则为基础的系统执行复杂的推理任务就是相对容易的。另一方面,联结主义系统已被证明长于像模式识别和运动控制这样的工作,并显示了可寻址内容记忆方面的潜力。这便促使我们追问:

9.在单一的认知模型中,把联结主义模型与以规则为基础的模型统一起来以取两者之长是可能的吗?

既然联结主义者把自己当作是为推翻更传统的、以规则为基础的方案的统治而进行战斗的革命家,那么他们试图推广新方案、冲破旧框框以搞清他们仅用这一方案能将研究推进多远,就不足为奇了。但事实上,对联结主义所作的大多数研究一直集中在这样的任务上,即紧接着一系统——比如说能识别它所面对的特定模式,并期待它的后续输入的系统——所作的特定反应之后的任务。然而在典型的人类认知中,对模式的识别并不是那一过程的终结。它可以为其他类型的活动提供基础。当我认出了我的猫时,我大概会看看:我为它留下什么食物没有,或把它今天的药物给它没有,或者我大概还会被促使对它说点什么。

在联结主义系统中,我们可以用两种方法设想作为过渡到其他认知加工的模式识别任务的完成。被激活的特殊模式可以把它的激活传递到与它以传递激活的方式相关联的其他模块上。或者,一种模式的识别可以激发规则应用于其上的进一步的加工。例如如果模式识别程序认出了我的上司,那么这可能有利于满足当时被激活的规则的前件:“如果我看到了我的上司,便问问我的旅行费”,接着就导致那种输出。

两种方案的倡导者都为和睦状态的建立提供了条件。联结主义者如拉梅尔哈特和麦克莱兰把他们的纲领描述为专注于认知的微观结构的纲领,这似乎提供了这样的可能性,即更传统的认知模型可以描述微观结构。拉姆尔哈特、斯莫伦斯基、麦克莱兰和欣顿(1986)曾试图表明:传统的以规则为基础的系统的某些特征如图式和结构的运用,怎么可能在联结主义系统中实现。图雷茨基(1986)也说明了怎样在联结主义系统中完成传统的LISP操作。

另一方面,以规则为基础的理论家,如福多和皮利辛(1988)都情愿设想这样的可能性,即在人类身上,以规则为基础的加工可能在像联结主义系统这样的东西上完成。这牵涉到的大概是:让以规则为基础的系统的形式推理原则映射到联结主义网络的状态上。不过福多和皮利辛在完成的方式与实际认知结构之间作了明确的区分。他们认为:这种结构一定是一种规则-加工系统,它运用了(1)复合句和语义学,(2)结构敏感程序。他们通过描述几种认知特征论证了对结构的这些要求,认为:这些认知特征需要这样的过程:(a)“虽然”(though)的产生率(即我们能通过递归过程建立复合命题),(b)认知表征的系统性(它由这样的事实所说明,即任何认为约翰爱玛丽的人也会认为玛丽爱约翰),(c)表征的构成性(即心理表征的组成部分大约赋予它表现于其中的一切心理表征以同样的语义成分)。不过福多和皮利辛又强调:不仅认知的那些特征需要规则-加工系统,而且所有的认知或心理活动都发生于那种结构中。那种结构完成于其中的系统的特征仅仅只是完成的问题,因此不是心理学家的问题。

即使我们暂时接受福多和皮利辛的下述主张,即认知的某些特征离不开规则-加工系统,但我们仍可以通过提出下述问题对他们关于联结主义的否定性结论提出质疑:

10.如果规则-加工系统在联结主义系统中完成了,那么这能说明以规则为基础的认知系统有认知的方面吗?

如果人类的规则-加工系统事实上在联结主义类型的系统中实现了,而且这使该系统具有像模式识别、概念学习、可寻址内容记忆等能力,那么实现的方式似乎就有认知的意义。有争议的不仅仅是实现的问题,而且也涉及到关于认知特性探讨的至关重要性问题。福多和皮利辛似乎假定:低水平的探究,如规则-加工得以实现的那些水平,对高水平的探究并无意义。他们认为:心理学探讨基本上属于自主性探讨。但在其他学科中,自主性假定则行不通。例如关于物理膜状物的结构的知识对于决定生物化学理论的形式就极为关键,反之亦然。而且研究者有时也发现:为了解决那些被认为仅限于一学科(如生物化学)范围内的问题(如氧化磷酸化作用),从其他学科(如细胞学)中引进方法就极其重要。(关于福多和皮利辛提出的各类自主性主张所面临的难题的进一步讨论,可参阅贝希特尔,1988a)尚不清楚的是:对实现的研究是否能为解释以规则为基础的系统内的认知加工的某些方面提供同样相关的材料。

为了提出一种把规则-加工与联结主义模型统一起来的更有效的方式,我将暂时转到概念和范畴化这一论题上来。概念是以规则为基础的认知加工单元的可能的候选者。早些时候,我曾论述过这样的可能性,即范畴化为概念可能在联结主义系统中完成,以致能利用该系统识别相似性、把例子与原型联结起来的能力。这样做还有进一步的利益。一般来说,甚至是在关于概念的罗施式的观点之内,概念也可被当作是相对稳定的。因而它们似乎就像思想中的原子——本身不可分或不可更改。但巴萨卢(1987,即出)为我们概念中的可变性提出了一重要的证据。罗施证明概念特性的手段之一就是:要求被试列举一个范畴的不同成员的典型性。她声称,在这种列举中已找到了被试间高相关的证据。然而巴萨卢则论证说:她的统计手段是无效的,因为当更适当的统计手段被使用时,典型性判断的被试间相关大约接近于0.4。而且他还发现:甚至就被试内部而言,典型性判断大约以一个月的时间间隔发生变化,只有0.8的相关。

基于这些结果,巴萨卢作出了下述推论:概念可能不是作为固定的单元储存在长期记忆中,而可能是由于特定的推理任务的需要而“匆忙地建构的”。在对认知的以规则为基础的说明内,阐释这种观点的意义是有点困难的,因为概念似乎是这些系统的原子。但根据联结主义观点,对之作出澄清则容易得多,因为在那里,存在于长期记忆中的东西仅只是联结。这些联结能使被试形成起着概念作用的、并可用于需借助于规则的问题解决中的表征,但概念没有必要是固定的,即使它们在以规则为基础的大多数说明中是原子结构。这一来,联结主义系统中的“实现”概念可能容许我们以直截了当的方式解释在其他情况下很难解释的概念的特征。此外,用联结主义系统表征概念的一个重要优点就是我们能利用联结主义系统的学习能力解释新的原概念是怎样学到的,这是一种为福多(1980)这样的规则-加工理论家所否定的现象,但它是可能的(参阅贝希特尔,1985b)。

我这里只是粗略地说明了联结主义和以规则为基础的说明怎样结合的问题,其基本观点是:联结主义系统中的状态可以当作是以规则为基础的加工系统中的表征(包括规则表征)。这样一种调解办法的优点是:联结主义系统的某些吸引人的特征可能为规则-加工系统所利用,而它们本身的显现又无需借助规则的发明(贝希尔特,1988b,在此我更详细地阐发了这一点)。显然在这种综合的系统建立之前,还有许多技术性问题需要解决,但开发这种系统至少是可能的。

认知的联结主义模型与神经科学说明的关系

另一由联结主义所引发的哲学争论是联结主义理论与其他理论的关系问题。一方面,有联结主义模型与神经科学模型的关系问题,另一方面,有联结主义模型与民众心理学的关系问题。这两个问题引起了这样的争论,即联结主义在某一方面是否是一种还原主义纲领。在最后两部分,我将依次探讨这些课题。一开始我就曾强调:联结主义模型是受神经系统的启发而建立起来的。单元的激活程度可看作是神经元的激活率;激活转向另一些单元可比之为神经元之间的信号流动。但很显然,联结主义模型本身不是神经模型,因为联结主义者无意于说明神经系统的全部细节。总的来说,联结主义者对于把他们的模型变成实在论的神经模型也不感兴趣。所以我们有必要提出下述问题:

11.如果联结主义模型本身不是神经模型,那么它们是关于什么的模型?联结主义模型的组成部分怎样与大脑的组成部分相关联?

倡导以规则为基础的模型的那些人有一种阐述关于他们模型的类似问题的自然方法:以规则为基础的说明阐述了由计算机或大脑中完成的更基本加工所实现的加工。它们是对真正的因果过程的说明,而且这些过程是在比个体的神经元甚或神经的集合体的活动更高的水平上发生的。不过,这种有利于联结主义者的回答几乎没有什么作用。联结主义模型中的活动如此像神经网络中的那些活动,以至于把它们当作是在那些网络中的加工模型便再自然不过了。

联结主义者解决这种争论的另一方法就是坚持认为:他们的模型是神经加工系统的抽象模型。就此而言,他们忽略了真实的神经系统的某些细节,因而只是描述了一般系统的特征(斯莫伦斯基,1988)。当他们的观点说明了先前视之为奇迹的某类过程实际上怎样由像大脑这样的过程完成时,在这种抽象水平上所作的分析事实上有极大的解释力。它证明,某些机制可以完成某些任务。而且这种方案还能为人们在中枢水平探讨理智指明方向。神经科学所面对的一个问题就是说明神经元活动怎样执行认知功能。联结主义模型说明了它们怎样出现在这些活动中,因而为未来的研究详细地确定神经系统怎样完成这些功能准备了方法。

在现在的条件下,把联结主义模型设想为关于神经系统的抽象说明似乎是合理的。但如果这是对的,那么联结主义模型就是对神经活动而不是对大脑中的高水平活动的说明。它们完全忽略了这种活动的某些细节。而且未来的一个合理的目标似乎应是发展对于神经系统实际上怎样起作用的更准确说明,而不是固守联结主义理论和神经理论之间的区分。神经模型与联结主义模型之间的差异似乎会融合为一种实用主义的差异——在发展我们对于大脑和认知的理解这个结合点上,考察各种类型的联结主义模型是有用的,而随着计划的发展,阐发关于中枢的更准确的解释将显得更加重要。然而,这就缩小了联结主义模型与神经模型之间的差别。这一点至少对某些联结主义者来说是重要的。

我所陈述的关于联结主义的观点似乎给予它在还原主义纲领中以显著的地位。如果联结主义模型成功地说明了全部认知现象,那么似乎可以准确地说,它们已说明了怎样把传统的认知理论化还原为神经水平的理论化。然而存在着一种不同的、而我们又可采纳的观点。认知研究(不管是联结主义的还是以规则为基础的)和神经研究之间的差别最好是当作研究者所提出的问题的类型的差别,以及他们用来回答问题的概念和研究手段的差别,而不是研究出现于其中的自然中的机体水平上的差别(参阅亚伯拉罕森,1978,关于接受此观点的各学科之间的关系的讨论)。进一步说,即使某些更基本的操作是在简单的联结主义网络中完成的,但其中一些操作也会涉及到这些网络与其集合之间的高水平的相互作用。像在前一部分所设想的那样,这就是以规则为基础的加工可能会出现的地方。高水平的活动可以用神经科学的术语加以描述,但用认知的术语描述它们也会被证明是重要的。作为联结主义观点的结果而出现的东西是否定这样的观点,即存在着可为认知理论化的独一无二的水平,而不否定这样的观点,根据这一观点,认知的理论化(中枢的理论化也一样)发生在不同的水平,其中的一些比传统的认知理论化的符号水平要低一些。

联结主义模型与民众心理学的关系

哲学家考察心理活动时,常常集中在民众心理学上。而民众心理学是这样一种观点,据此,我们认为人是有信念、有愿望的,进而我们在信念和愿望的基础上解释他们的行为。哲学家们关心的主要是:在心理学和神经科学的实验探讨得到发展之后,民众心理学的结局将会怎样。在民众心理学中,我们描绘的人是这样的,即根据信念和愿望作出推理以决定该做什么,因而这种民众心理学就是下述观点的一个源泉,即认知是一种以规则为基础的加工过程。既然以规则为基础的认知模型使用了存在于民众心理学说明中的逻辑推理模型,还用了作为科学心理学基础的那种结构,那么他们必然会维护民众心理学的有效性。另一方面,如果联结主义者在他们坚定地主张心灵不是以规则为基础的系统时是正确的,那么他们似乎剥夺了民众心理学以及以规则为基础的认知心理学的合法性。这种可能性为取消论的唯物论者P.S.丘奇兰德和P.M.丘奇兰德所强调,他们认为:关于大脑实际上怎样完成认知任务的联结主义及相关说明表明了拒斥民众心理学的必要性,正像我们已知道的、对民众物理学和民众医学的拒斥那样(参阅P.S.丘奇兰德,1986,P.M.丘奇兰德,1986)。关于联结主义要提出的最后问题是:

12.如果联结主义模型是正确的,那么这说明了我们必须摈除民众心理学吗?或者说民众心理学仍有其地位吗?

两位丘奇兰德坚持认为:心理学(尤其包括民众心理学)要么必然还原为我们关于心/脑怎样工作的最佳理论,要么就是被摈除。所谓还原,他们想到的似乎是哲学意义上的还原,在此还原中,民众心理学的术语与来自于对心/脑的科学说明的术语是同一的,因而对民众心理学的理论说明是由我们关于心/脑的新的理论说明派生出来的。他们怀疑这样一种还原的可能性,因而呼吁摈除民众心理学。另一方面,他们把联结主义模型当作是关于心/脑操作的潜在正确的说明,因而当作民众心理学的潜在的替代品。这里我既赞同对还原的否定又赞同这样的主张,即联结主义对心/脑怎样工作可以提供基本正确的说明。我所要探讨的是:我们是否必须作出这样的选择:要么把民众心理学还原为联结主义理论,要么予以摈除。

让我简述一种可供选择的看法。即使关于认知的、以规则为基础的说明的某些支持者把民众心理学当作是关于心灵实际上怎样工作的、以规则为基础的模型的原型,但这可能误解了民众心理学的功能。民众心理学最好被理解为关于人的说明,而不是关于人的内在心理过程的说明。人有信念和愿望,但这些并不是人的内部状态。民众心理学可以为我们提供一种描述面对环境的人的方法,但事实上人不可能内在地表征他们环境的一切方面。他们的内部状态使他们能根据他们所面对的环境的特定方面适当地行动,但绝没有构成那种知识的内部状态本身(贝希特尔,1985a)。

如果这是正确的,那么民众心理学不能还原于联结主义这一点就没有剥夺民众心理学的存在资格。我们可以一如继往地主张:民众心理学提供了对于行为主体的描述,具体说明了它所具有的、关于它的环境和它的行动目的的信息。就此而言,民众心理学(或某种关于它的修改过的看法)仍会扮演重要的角色。实验的理论化有时所面对的一个危险就是建构理论模型,以说明这样的行为(如记起瞎说过的话的能力),它们能在实验中诱发出来,但是在有机体应付它们的日常的生活时,这类行为并无重要的作用。对于人有关于他们的世界以及他们在其中所进行的认知活动的什么信息,民众心理学给了我们一种透视的方法。当然它不是获得这种方法的唯一途径。对于心理学的生态学研究就是另一条途径,它强调的是认知主体的真正生存活动(参阅尼瑟,1975,1982)。我的主张不过是:描述人及其所拥有的关于他们环境的信息的这类方法,对于那些想发展任何内在加工说明——联结主义的或以规则为基础的说明——的人有着至关重要的作用。因而这种观点不会为内在加工说明所摈除。恰恰相反,一种成功的内在加工说明将会解释:当某人面对一现实环境时,是什么使他满足民众心理学

【注释】

[1]译自W.利康编:《心灵与认知文选》,巴兹尔·布莱克韦尔,1990。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈