首页 理论教育 机器发现与科学发现的逻辑

机器发现与科学发现的逻辑

时间:2023-11-30 理论教育 版权反馈
【摘要】:第3章机器发现与科学发现的逻辑西蒙的机器发现研究,在出现的时间上正好与科学哲学内部对科学发现逻辑问题重新关注的趋势相呼应。第1节计算机模拟发现的工作是不是重新“发现”许多围绕BACON的讨论都集中在,BACON的工作是不是重新“发现”。西蒙小组转而致力于开发多个程序分别完成发现的不同子任务。事实上,这是发现的复杂性使然,也是认识规律使然。

机器发现与科学发现的逻辑

第3章 机器发现与科学发现的逻辑

西蒙的机器发现研究,在出现的时间上正好与科学哲学内部对科学发现逻辑问题重新关注的趋势相呼应。于是,许多科学哲学家以及关心科学认知研究的认知科学家,都纷纷讨论MD系统究竟对科学发现逻辑有什么意义。本章我们先回答前面提出的问题:BACON的工作在何种意义上是发现?然后讨论机器发现对“发现的哲学”的复活的意义。

第1节 计算机模拟发现的工作是不是重新“发现”

许多围绕BACON的讨论都集中在,BACON的工作是不是重新“发现”。前面我们分析过,一些学者因为对西蒙的“发现就是解题”的发现观持有疑义从而认为,BACON只是完成了一个普普通通、类似学生在学习中解决一道数学题的任务。如果说从BACON的工作是解题方面来质疑BACON的发现只是反映出一种与西蒙发现观迥异的发现观的话,那么,说BACON的工作根本就不是重新“发现”,对BACON来说则是一个致命的反对。

1.BACON的工作是“金子进,金子出”吗

许多人对所谓机器能做发现或重新发现持一种嗤之以鼻的态度。他们认为,程序的启发式算法不是由人来设计的吗?那么,设计者已经将自己的发现意图事先编好程序装入计算机中了。比如对BACON系统,几位不同研究领域的学者就表明了这种批判态度。

乔治·康斯特布尔(George Constable)在他1986年主编的《人工智能》一书中,引用了莱奈特(D.B.Lenant,设计了AM)对BACON的否定:“你给BACON成对的无错数据,于是BACON就得出一个数学表达式将输入与输出联系起来,……你可以称之为发现了物理定律,如果你想这么叫的话,但你真的是很难那么叫它”[66]

布兰尼根则批评BACON程序说,“程序是在收集好的数据基础上进行操作的,……并且之所以选择那些数据是因为它们已经被证明是成功的。金子进,金子出(Gold in;gold out)”[66]

而且怀疑机器发现的人们还会质询:如果计算机真的能做发现,那么,让它面对某个实验室记录本上的许多杂乱无章的、人们没有进行整理的数据,它就应该做出我们不知道的发现;如果计算机真的能进行重新发现,那么,我们给它任意历史上科学家使用过的真实数据,它都应该能重复出实验的结果。

面对怀疑者们假设的这两种情况,我们的回答是,不仅BACON、现在任何AI程序都不会得出令你满意的结果。

一方面,现有的MD程序都只是模拟了发现之复杂过程中的某一个方面的若干细节特征。BACON是模拟人类从数据中发现规律这方面的发现工作。那么,要完成的这个总任务都包括哪些子任务呢?从BACON.1开始,使用了探测数据规律的启发式,它完成了找到数据模式的子任务,但是它重新发现的只是少量几个简单函数关系;到BACON.3,修改了启发式,使其不区分数据和假设,于是BACON发现的定律在范围上变广、在复杂度上大大增加;当继续给BACON新的版本增加新的启发式,如定义理论词项、寻找公因子等等,BACON系统又能发现许多化学上重要的定律。

但是,BACON只是一个重新发现经验规律的计算机系统,不能发现解释性定律、不能设计实验、不能完成许多发现任务。而且,尽管BACON的启发式越来越丰富,BACON发现的经验定律也还是有限制的,它不能发现所有的经验定律。因为这中间有一个发现任务的确定性和一般性之间的矛盾。

计算生物学学者米洛萨夫列维奇(Aleksandar Milosavljevic)从他的专业信息理论领域给出一个发现的定义,“发现过程可以看成是一个无限的搜索关于观察数据的更简明编码的过程”。所以选择的编码语言优化就很重要。但是,他从自己的实际工作中总结说,“编码的最优选择总是在两个相互矛盾的准则之间的平衡:一个是,实现假定最少(这样的编码语言有足够的一般性);一个是,能够在合理的时间内计算出短的编码(这样的编码语言足够明确)”[75]

米洛萨夫列维奇说,由于在完成一个发现任务时不可避免确定性和一般性之间的矛盾,所以实际工作中,“一种编码语言是根据数据中预期可能存在的模式来设计的”。与此对应,我们知道,BACON的设计者之所以选择OPS语言而不是其它的计算机人工智能语言,也是与BACON程序所要解决问题的模式有关的。对于AI来说,解决不同的问题就要选择与问题相适应的不同的语言。看来这似乎向我们表明了AI发展的一个客观限制条件。

米洛萨夫列维奇还根据算法信息理论(algorithmic information theory)第二条主要定理得出结论,不存在一个通用的发现算法,即由机器做通用性的推理是不可能的。

由此我们联想到,为什么从20世纪50年代AI起步之时,西蒙小组致力于通用问题求解,而20世纪80年代以来,西蒙却一再强调发现是一个复合的事业?强调“没有任何一个MD程序能包括发现的所有方面”?西蒙小组转而致力于开发多个程序分别完成发现的不同子任务。事实上,这是发现的复杂性使然,也是认识规律使然。细想一下,即使人类的科学事业不也是一样吗?学科划分越来越细,新学科越来越多。每一位研究者终其一生,能在某一学科的某个研究领域内有所造就已经很不容易了。像西蒙这样的科学大师,研究横跨人工智能、认知心理学经济管理学。但他的主要基础还是AI,他利用AI建模提出关于人类思维的理论,再将这一理论用于解释科学中人的认知活动,这构成他的认知心理学成分;将这一理论用于解释经济领域中人在决策时的思维活动,这又构成了他的经济管理学研究。贯穿他研究生涯的还是一条主线,利用计算机模拟解释复杂认知活动中可能的规律。

我们还是回到BACON的发现问题的话题。事实上,虽然通用问题求解程序已经不可能实现,但是成功的MD程序在完成某一类发现任务时又是具有一般性特征的程序。BACON正是这样的程序。前面已经讨论过,它在经验定律发现方面具有一般性。

另一方面,当西蒙面对这种批评时常常回应说:如果说BACON的工作是“金子进,金子出”,那么,即使你、我、还有真正的科学家本人也一样如此。

西蒙说过,发现就是“目标状态不完全确定”的任务,“不完全确定”不是完全不确定。完全不确定的问题将不是科学研究的问题,因为我们还不知道应该从何着手来进行实验。而且观察渗透着理论,科学家本人在从事一项观察时,总是有计划的、有目的的。所以,任何发现任务中的数据都不可能是杂乱无章的。他在进行实验时会对实验进行设计:从哪些方面研究当前的现象,做哪些实验,实验的具体步骤,每个步骤要测量哪些数据,每个步骤以什么属性为自变量等等。任何做过物理学、化学、生物学等实验的大学生都会对比如析因设计之类的策略有些感性认识

所以为了使BACON模拟人的思维,同时也检验那些我们在人类发现过程中总结出的特征,像析因设计、探测常量、形成新概念、表示方式等等策略是不是真的对一个发现任务有效,就将这些人类思维中运用的策略设计成启发式装入MD系统中。这不能叫“金子进,金子出”,因为人类科学家也是这样做的。

但还是有一个问题,人类科学家具有这些研究策略是“自动”产生的,而MD系统的这些策略却是人类设计者从外面给它“装”进去的。人类是主动的,计算机是被动的。我们看看西蒙对这个问题是怎样回答的:

虽然科学发现是科学工作者的个别研究活动,但是科学工作者个体是处在一个更大的科学社会结构之中的,通过公开出版物这块“黑板(blackboard)”(以及直接的合作),大家相互联系在一起。假使一个人独自工作,他的研究过程也要受到作为先前的社会影响之结果储存在他的记忆中的那

些知识和技能的强烈影响。在这种意义上,所有关于发现的研究都是社会心理学的或者甚至就是社会学[44]

社会与科学家个体产生冲撞,发生的影响留在科学家的记忆中,因此科学家的记忆就是知识储藏库。而记忆内容就是最初的并且是边界的条件,并且还是社会情境的替代品。我们研究科学家获取和应用的这一知识基础,这一知识基础是输入给发现过程的一个基本部分,在研究这一知识基础时,我们考虑了社会情境[44]

乍一看,我们会以为西蒙在宣传SSK的社会因素决定论!但是接下来,西蒙批判说,当代一些科学社会学者将社会因素的作用夸大为科学知识的增长被“外部社会因素”所塑型,我们看出,西蒙在这里的阐述是对1989~1991年的一场论战的延续(关于这场论战,详见第5章)。西蒙论述中强调的社会因素的作用,实际上特指“内部社会因素”。从西蒙的分析中我们知道,所谓内部社会因素的含义是:有“黑板”中前人的思想、研究成果,也有同时代其他科学工作者的思想和研究成果。此外,科学工作者个体还要同别人相互协作,从而发生相互影响。

西蒙如此强调发现是社会性的事业,甚至是内部社会因素所塑型的“社会学的”事业,一方面是批评SSK;另一方面才是他在这里谈机器发现的真正用意:他对社会性的强调是在为BACON等MD程序辩护,是在回答人们对BACON的工作是所谓“金子进,金子出”的质疑。不是吗?科学家离不开他置身其中的那块黑板,他研究中运用的那些策略、他研究中运用的背景知识,不是就来自那块黑板吗?所以我们给BACON或其它MD程序装入启发式,还有作为边界条件的知识背景,不正是恰恰体现BACON在模拟科学家个人的发现“情境”吗?

至于人们还会说,人类是主动吸取知识的,而BACON是被“喂给”的。这个问题西蒙和兰利他们都非常清楚,这也是他们对未来发现系统的期望——能够自动从“黑板”中获得知识。而人类心智具有的自动获取知识的那种天然的“禀赋”究竟是什么,计算机能否模拟的问题,则属于复杂的、一般性的人工智能哲学问题,在此我们暂不讨论。

2.BACON只是“捕捞数据”的机器

还有一种否定BACON的发现意义的意见。他们认为,BACON的工作是靠无遗漏的“蛮力搜索”完成的,或者说BACON就是撒网式“捕捞数据”的机器。布兰尼根认为所谓人工智能的进展,就是计算机取代人的许多生产线式的单调劳动[66]。他的这种观点几乎完全否定了计算机技术中人工智能这个领域的独特价值。科林斯也明确说,“BACON等程序就是在撒网式地无遗漏地搜索数据”[76]。还有,科学哲学研究者孔宪中(Edwin.H-C.Hung.)不像前面两位对BACON以至整个AI都持否定态度,他对AI热情肯定并关注AI的哲学问题。但是,他在分析BACON时,也是错误地将BACON的发现方法等同于逐一试错(具体讨论见下一章)。

对于这种反对意见我们不需要再做详细分析了。因为从前面西蒙强调他的方法是高度选择性试错搜索而非盲目地无遗漏的试错,我们已经清楚了启发式搜索和“撒网捕捞数据”之间的区别。其实在计算机科学领域大家已经公认,启发式搜索是AI程序区别于一般计算机算法程序的关键一点[77]。另外,从MD研究发展的整体来看,现在已经开发出的具有多种功能的发现程序,也是对上面认为计算机只会蛮力搜索的偏见的最好回应。

3.关于机器发现的意向性问题

意向性问题是人工智能哲学领域争议最多的问题之一。同样,这个老问题在BACON的重新发现工作中又“老话重提”了。但是从一个具体的AI实例来讨论,比之纯哲学探讨更有助于厘清争议。

许多反对称BACON的工作是发现或重新“发现”的意见集中在意向性问题上。博登曾说:“计算机发现程序不会意识到它们的发现的重要性。科学史中,荣誉经常拒绝那些没有鉴别出发现重要性的人;同理,计算机程序也不应该得到对任何发现的荣誉”[46]。吉尔认为,BACON就是一个纯粹的语法机器,它所做的是根据符号的结构进行符号的操作,操作的符号就是0和1组成的字串。对BACON来说,这些符号的意义和所指它是不知道的。戈尔曼同意吉尔的观点:计算机根本不知道自己在做什么。

的确,一个都不知道自己在做什么的机器,怎么能说它是一个“发现者”呢?西蒙也说过,成功做出重大发现的人比一般人可能具有更持久的“解题”的热情。无数科学家的传记、科学史料也告诉我们,科学家为了找到答案甚至都到了近乎痴迷的状态了。可是像BACON这样一个没有意识地工作机器,即使它找到了数据关系,它也不知道这是一个开普勒定律或波义耳定律,能说它的工作是发现吗?

人们对计算机发现的这些疑虑,主要涉及体现意向性的一个常见意识状态——“知道”。什么叫“知道”,它既涉及语言学中的语义问题,也涉及到认识论中的客体及其名称之间的关系问题。坚持强AI观点的人和坚持反AI观点的人在这方面分歧极大。分歧的关键是对所谓“知道”的不同理解。

西蒙认为计算机程序具有语义学特点。他说,意义[至少一个重要的意义形式]来自于这个事实,我们能给符号分配被编码的可感知的确定输入模式[即,我们能把“猫”指定给那种确定模式]。这样我们有两套模式——一套是名称,一套是被编码的知觉对象。二者的对应关系构成了语义学[78]。我们认为西蒙为计算机程序所做的语义学特点的辩护是正确的。但是也应该看到,不是人类的所有语言或感知都能够转化为计算机程序能够体现的这种语义形式的。

我们以维特根斯坦(Ludwig Wittgenstein,1889~1951)的语言学研究为例进行说明。维特根斯坦的理论一方面为计算机程序的语义特征确立了基础。但在另一方面,又表明了计算机语言所不能呈现的语义范畴。维特根斯坦认为,语言的意义不在于指称事物,而在于行动。比如,“取三个红皮球”这句话,计算机可以执行,是因为我们可以把这句话中包括的三类动作:数数、识别各种颜色、识别皮球,都分别与一系列的规则、事物的属性及关系联系在一起,比如数字的规则、颜色的规则和形状的规则。有了确定的规则、属性还有联系,就可以编写指令。我们可以说,当计算机在执行这些指令的时候,它对这句话的理解与人类的理解没有什么差别。

但是,有一些语言无法将其意义转换成明确的、相应的规则、属性和关系。比如“嘲笑”、“抑郁”这类词。如果我们试图编写一些行动指令让计算机执行,那结果一定是让人泄气的。计算机也许会把一个正在静静体味内心喜悦的人的状态当成抑郁,或者干脆把幽默当嘲笑。

虽然西蒙的语义学观点可以从罗素(Bertrand A.W.Russell,1872~1970)的语义学理论找到支持,但是近二十年来的语言哲学中已经发展出一种与罗素相对立的观点,如普特南(Hilary Putnam)所说,“对这个问题想怎么处理就怎么处理吧,‘意义’就不在头脑里!”[79]

我们认为,目前范式下的计算机程序仅仅涉及到复杂的语义学问题中的一个方面,正在出现的其它AI范式将引发更多更复杂的语言哲学问题。在意识到现有AI的局限性的同时,明斯基对AI思维能力的思考对我们或许有些启发。他认为,人们通常的语义学研究,就像数学中为寻求数的含义所进行的工作,是单线型的、塔式的,也是脆弱的,一旦一个层次出了问题整个工作就倒塌。当然,在数学上应该进行这样的工作,这是数学的基础,而数学的基础完备了,整个人类认知活动就有了可靠的工具。所以这对数学是很有意义的。但是,人类日常认识活动并不关心数学基础问题,也不会发生关系。日常认识活动中运用的语义是网络式的、交错的、并行的多路知识网络,一个途径“失灵”,可以换另一个[80]

也许,计算机模拟人的日常思维活动,其中对语义学问题的处理思路与语义学理论研究中的方法应该不尽相同。因此,西蒙、明斯基这些实际工作的AI科学家总是对认识论、方法论问题给出一种实用的或技术性的解释,按照博登的说法是物理主义的解释。

哲学家丹尼特(Daniel.C.Dennett)也提出支持强AI的工具主义的意向性说明,他认为,一个系统只要被赋予了信念、目标和推理能力,从而人们可以解释、预见和控制其行为,这样的系统就是意向性系统。而强烈反对强AI的哲学家塞尔对意向性的解释是一种强实在论的观点,概括为两点:意向性必须以生物特性为基础;纯形式主义理论不能解释心理特征。另外一类持中间立场的哲学家,如博登、史密斯(B.C.Smith)、斯洛曼(A.Sloman)等人,一方面反对把计算机程序表示为完全句法的而非语义学的作法,一方面承认,目前的计算机程序所具有的语义不是指称性的,而是因果性的[58]

总之,我们应该说BACON程序虽然不是一个真正的发现,但完成了部分的发现工作,它的工作具有发现意义,对之的讨论引出我们对一些传统发现哲学问题的新思考。

第2节 机器发现与“发现的哲学”的复活

在导论中,我们曾经给出了科学发现逻辑历史的简单描画:从可以上溯到亚里士多德时代的起源→17、18世纪当时最重要的哲学家、科学家进行的大量的工作→19世纪下半叶这项事业的完全衰落→20世纪70年代以来的复兴。令我们关注的是,同时在20世纪70年代兴起的MD领域的发现理论,与科学哲学内部“发现的哲学”的复活有着怎样的关联。如果说,因为某些复杂原因“发现的哲学”衰落了,那么,对它的复兴是否已经有适当的理由呢?像BACON这样的发现程序能称为理由之一吗?

我们试图将这些问题串起来以展现复兴科学发现逻辑的理由和这项事业的新途径。

1.传统科学发现逻辑为什么被抛弃

当代几乎所有关注科学发现逻辑的研究者都试图找出其曾经被“抛弃”的种种原因。但是又几乎没有人能说得清楚。要试图对整个过程进行重建,描述出一个关于科学发现逻辑怎样被忽视的逻辑的历史,是一个相当困难的任务。在这里,我们只能简要地分析一些可能的因素是怎样促使这个曾经兴旺的事业日渐衰落的。

首先,科学发现逻辑的被抛弃,或许是可错论(fallibilism)对不可错论(infallibilism)的取代以及割裂两种情境(发现的情境/证明的情境)两方面因素双重作用的结果。

劳丹(Larry Laudan,1941~)曾专门撰文分析“发现的逻辑为什么被抛弃?”[1]。他将历史上进行科学发现逻辑问题研究的目的概括为两点:一方面是启发性和实用性目的,通过阐述行之有效的发明和创新规则来加速科学进步的步伐,增大做出新发现的速率。另一方面也是更重要的是认识论目的,发现逻辑为科学认识提供可靠保证。这种发现逻辑将是产生新理论的工具,同时,因为它的不可错性(infallible),它又自动地为由之产生的理论提供可靠的认识论基础。第一种动机在培根身上表现最为明显,而大多数方法论家出于第二种目的对研究科学发现逻辑怀着极大的热情。

劳丹的这个阐述具有某种经典性意义,被人们多次引用。他论断的核心一点就是,历史上研究科学发现逻辑的最重要的目的还是认识论目的。这种对科学发现逻辑的定性也与大多数科学哲学家的感受相吻合。尼克尔斯说:“的确,对许多方法论家来说,这(指科学发现逻辑)才是对一个科学理论仅有的完全充分的证明。”[81

我们都熟悉一个早在柏拉图和亚里士多德时就发现的逻辑谬误,肯定后件谬误,即,一个理论推演出若干推论,推论为真,并不能充分证明理论为真,而如果推论非真,则一定说明理论非真,就是说,在逻辑上后件是前件的必要而非充分条件。因此因为这个谬误,认识论者一般都承认对理论的后验检验不能充分证明理论的确实性。

由于19世纪以前的哲学家,从亚里士多德和柏拉图,到洛克和莱布尼兹,到笛卡尔和康德,都持有一种不可错论的认识论:合理的科学是既真又已知为真的陈述(be true and known to be true)[1]。那么,怎样才能证明理论为真呢?由于肯定后件谬误,就只有确保真理性的发现的逻辑能证明理论的确实性。这样,发现的逻辑有了其值得研究的基本理由。我们看到,这个基本理由使得传统“发现的哲学”和不可错认识论形成一种似乎是“荣辱与共”的密切关系。

渐渐地这种认识论传统发生了变化,而主要促动力之一就是,17世纪中叶到18世纪,英国经验论用经验取代天赋观念作为知识来源的地位,在倡导知识的理性的同时,也为知识的可错论埋下伏笔。一种真正是理性的知识最终必会将捍卫理性的矛头指向这种知识本身。正是这种经验主义理性传统孕育了对经验、对感官领悟的批判——实证主义的萌芽。英国经验主义代表人物之一休谟通过他的怀疑论,使人们对自己理智能力的界限和知识的范围有了“较为谦和、较为含蓄”的认识,知道了自己能力和知识的缺陷,从而开始以“可错论”的态度反对“独断论”的态度[82]

可错论的出现从根本上动摇了探讨发现逻辑的必要性基础。既然任何科学知识都是可错的,不能建立永真的理论,那么也就没有什么“发现的逻辑”,发现只是一种如惠威尔(William Whewell,1795~1866)认为的“幸运的创造性智慧的闪现”。

与此同时,当证明不再被当作证实理论为真的事情,则所有关于后验检验不具有决定性的批评就无关紧要了,不仅如此,后验确证在表明一个理论具有近似可能性方面还是唯一有效的手段。如赫舍尔(John F.W.Herschel,1792~1871)明确表明的:

因此,在研究自然时,我们不必怀疑关于全部事实的知识,如定律和理论,是如何得出的:只要在它们被陈述出来之后,我们仔细地证明它们,就一定能满意地把握住它们,而不用管它们是在哪里发现的。[83]

在赫舍尔的论述中,已经把发现的逻辑和证明的逻辑割裂了开来。后来人们都将赖欣巴赫(H.Reichenbach)1938年的著作《经验和预言》中对“发现的前后关系”和“证明的前后关系”的著名区分,作为两种关系的分割乃至科学哲学只关心后者而排除前者的声明。但在此之前,发现的逻辑已经长时间无人问津了。赖欣巴赫的区分,还是波普尔波普尔1933年在其《研究的逻辑》中将发现的逻辑进行的“心理主义的排除”[84],都不过是在阐述各自研究纲领时总结一个已有的事实。由于逻辑经验主义运动以及批判理性主义对20世纪哲学的深刻而广泛的影响,人们在70年代重新关注科学发现逻辑时,往往将二人的阐述作为反对发现逻辑观点的“标志”。

图3-1 科学发现逻辑的历史兴衰背景[48]

除了“可错论”和两种关系的区分这两个线索之外,人们还对科学发现逻辑的被遗忘提出种种可能的原因:

其一,历史上方法论家致力于一种确保真理性的发现逻辑的尝试都以失败告终,所以不得不放弃。

其二,19世纪以来的科学发现,越来越多地表现为对抽象的解释性定律的假说-演绎(H-D)结构,而越来越鲜见从经验数据中归纳出可直接检验的描述性定律。因此,“自上而下”的H-D方法取代了培根式的“自下而上”的归纳方法成为通用的科学方法。这种背景下,如果实证性还是自然科学不可缺少的基础,那么这种实证特征是体现在证明而不是发生环节。

其三,与前一个原因有关系,归纳法的衰落也是发现逻辑的衰落的部分原因。而美国的实用主义运动可能加速了归纳方法论的衰落。如同在社会生活中一样,思想领域中要紧的事也是结果而不是先前的事[81]

其四,由于现代物理学的兴起,长时间占统治地位的牛顿式世界图景衰落,让位给爱因斯坦的相对论世界图景。“今天的基本粒子物理学中遭遇到的现象,既不是因果的,也不是可描述的,甚至不是任何经典意义上的力学的,……导致物理学家提出,现代科学中因果律的崩溃,是无法挽回的事”[85]。由此导致的归纳方法在科学研究中地位的丧失。

此外,恐怕还有一种根深蒂固的传统观念的作用。在人类文明史中,对科学知识的发现一直被赋予一种浪漫的、天才的、夸大的幻想[17]。科学知识似乎常常与人们感性直观的常识相悖。比如,哥白尼太阳中心说替代了与人们感觉更相符的托勒密地球中心说;伽利略的科学思想实验证明亚里士多德认为的“重量越大的物体其下落速度越快”的观点错误,而后者的观点在人们的常识看来是毋庸质疑的。于是,人们渐渐地认为,科学发现总是由具有古怪个性的人,在奇怪的环境中取得的奇特的成就。

科学家的传记更是传递给公众一种印象:科学家获得发现是由于奇妙的灵感、顿悟、直觉。家喻户晓的阿基米德的故事,使发现就等于“尤里卡”(Eureka,希腊语意为“发现了”)时刻;彭加勒(J.H.Poincare,1854~1912)解决困扰他好久的那个非欧几何变换问题,他回忆说是受益于一次出外旅行时突然降临的顿悟;凯库勒(von Stradoniz August Kekule,1829~1896)梦中那条舞动的小蛇给了他灵感,提出苯环假说;还有,爱因斯坦的广义相对论也是来自于他年轻时做过的一个梦,梦中他试图追上一束光等等。其实,这些故事的盛传正说明我们对科学发现过程的“科学的”解释不足。

2.复兴的科学发现逻辑是溯因式的逻辑

对科学发现逻辑的复兴计划,人们从亚里士多德那里找到源头。亚里士多德在他的《前分析篇(Prior Analytics)》和《后分析篇》中,列出了推理的三种类型:演绎、归纳,以及一种叫做“απαγωγη”的推理形式。最初有人曾将其翻译为英语的“还原(reduction)”。后来,皮尔斯把它翻译为“abduction”或“retroduction”,逻辑上称之为不明推论式,即,大前提完全正确,但小前提仍有问题的三段论法。中文翻译不统一,上海辞书出版社2001年出版的《哲学大辞典》译为“回溯法”、“溯因法”,其他翻译有“逆推法”[86]、“假说推理”[87]、“假设”[88]以及“发想法”、“外展法”等多种译法。我们这里采用比较普遍的翻译:“溯因”。

亚里士多德认为这种溯因推理的不同之处在于:

中项同前一个项(term)的关系不确定,尽管具有与结论相同或更多的可能性;或者又一个判断,其中,前一个项与中项之间的媒介项几乎没有。

因为在这些情况下,我们更接近知识……既然我们已经采用了一个新的项。(转引自参考文献[85]。同时汉森还比较了Whewell的阐释,“不仅把特殊事实放在一起,而且通过特别的思考行动把一个新要素增加到组合中……。珍珠都在那里了,但是还不能把它们串起来,直到某个人提供了一根绳子”)

现有资料表明,皮尔斯是历史上第一位阐发亚里士多德的“απαγωγη”对发现逻辑的重要意义的学者。他举了三个例子分别对应三种推理形式,在比较中他将“abduction”方法对发现的作用突显出来:

第一种是演绎:

从这口袋里倒出的所有豆子都是白的。

这些豆子是从这个口袋里倒出来的。

因此,这些豆子是白的。

第二种是归纳:

这些豆子是从这个口袋里倒出来的。

这些豆子是白的。

因此,从这个口袋里倒出的豆子都是白的。

第三种是abduction:

从这个口袋里倒出的所有豆子都是白的。

这些豆子是白的。

因此,这些豆子是从这个口袋里倒出来的。

皮尔斯将三种推理的区别总结为:归纳启动了一个理论并且它量度了该理论与事实的和谐程度。但它从来未能发起任何思想。演绎也不能。所有科学思想都是通过Abduction出现的。Abduction包括研究事实以及构思一个理论去解释事实。它的仅有证明就是,如果我们要不断地理解事物,就必须以Abduction方式。无论对其他推理而言还是对演绎而言,Abductive推理和归纳推理都绝对不能削减,反过来,演绎对这些推理而言也同样不可削减……(转引自参考文献[85])。

继皮尔斯之后显著强调abduction或retroduction方法的学者就是汉森。人们通常都说,汉森在将近半个世纪之后“复兴(revived)”了皮尔斯的发现的逻辑,这句话是不错的。从我们的考察中也表明,汉森在阐述这种推理的具体含义时,几乎每次都引用皮尔斯的原话进行阐发。但是汉森的重要贡献在于,他对物理学史进行了深入考察,对伽利略和开普勒等人的重大物理发现史料进行了全面、细致的分析,再加之他的良好的物理学背景,他对历史发现的跳跃式过程进行了数学和物理学合理性的重新推演,为abduction方法在科学发现中的作用给出了颇有说服力的证明。汉森分外强调重视历史考察这种哲学分析思路。他在写作《发现的模式》的时候,“毫不犹豫地引证物理学史中的事件”,为此不断打断其它论断。但这就是汉森的科学哲学理念:“对任何学科而言适当的哲学讨论都依赖对该学科历史及现状的熟知”[85]

汉森在与皮尔斯的区别基础上,提出自己对三种推理形式在科学研究中作用的理解,他与皮尔斯都认为这三种推理不是相互替代的关系,而是相互补充,在科学研究中各司其职:演绎证明某件事一定是什么;归纳表明某件事实际是起作用的;而abduction仅仅提出某件事也许是什么。汉森将这种推理形式总结为:

(a)观察到某种意外的现象P。

(b)如果H为真,则P将作为必然结果得到说明。

(c)因此,有理由认为H为真。

汉森认为,这里的H即假说,总是在先有现象P之后才出现的,所以,既不是如H-D方法认为的,先有假说,然后从假说推出现象P;也不是如归纳认为的,假说是不断积累的现象P中总结出来的规律。假说不是这样被提出来的。汉森说,正是在溯因方法(我们采用abduction的这种译法,是由事实向回推理找寻原因之意)中才出现假说。而假说H不是一个创造也不是一个规律,而是可能的假说,其可能性由假说与现象的符合程度来决定。

皮尔斯和汉森相继提出的复兴科学发现逻辑的计划,总结起来就是:科学家面对问题时,往往有无数种可能的解决方案,但是科学家实际只操作少数几个。这说明科学家在提出假说时是有标准的,最后被考虑的是最具有“似然性(plausible)”的假说,评价标准就是与已经观察到的现象的符合程度。所以在科学研究中,新的思想的发生(generate)是有理性途径的,这就是溯因方法。溯因方法虽然不是必然性的逻辑形式,但是它的确是一种理性的科学推理形式。

有学者评价皮尔斯对逻辑的贡献是,“发展了一种新的、革命的逻辑,它足以削窄在逻辑与科学发现世界之间的鸿沟”[89]。而后来“发现之友”们提出口号“没有发现逻辑的方法论”是对此的回应。

另外,我们对汉森本人考察发现模式的思维特征进行的考察表明,汉森通过科学发现过程中的种种合理性推理模式,建立一个适合描述基本粒子物理学的科学发现的理论,整个过程所体现的主要思维特征既不是归纳式的,也不是演绎式的,而是溯因式的。汉森“不是考察观察、事实和数据怎样被集结和扩大到关于物理学解释的一般性体系中”,而是考察这些体系是如何作为“对事实和数据的观察和评价之整体而建立的”。这正是“研究事实以及构思一个理论去解释事实”的溯因法的生动体现。(www.xing528.com)

背景介绍:HPS与IU的历史

(1)汉森与美国第一个HPS系的创立

汉森曾被称为美国哲学界的“小英雄”,在短暂而精彩的一生中,勇敢、冒险、创新甚至标新立异的风格在他的生活、工作和研究中,可谓体现到极致。

图3-2 汉森创立的印第安纳大学科学史和科学哲学系当前所在处-1936年建成时叫Forest Hall,1962年改名为现在的Goodbody Hall
(照片来源:庞秦山王小红摄于IU,2007年7月26日)

汉森1924年生于美国新泽西州(New Jersey)。二次世界大战中,作为美国海军陆战队战斗机飞行员(Marine Corps fighter pilot),曾参加对日作战。因勇猛善战升至少校军衔,并获得杰出飞行十字勋章和空军奖章。战后,利用国家给退伍老兵接受高等教育的福利,他开始追求实现学术上的雄心。汉森的学习经历几乎遍及美国和英国最著名的大学。先是就读芝加哥大学(University of Chicago),1946年获得哲学学士,随后分别于1948年和1949年获得哥伦比亚大学(Columbia U-niversity)物理学学士和硕士学位,还在耶鲁大学(Yale University)学习过。然而,他探求学术的雄心远未停止,1950-1952年在富布赖特(Fulbright)基金资助下,又远赴欧洲,在牛津大学(Oxford University)和剑桥大学(Cambridge University)深造,并于1955年和1956年先后获得这两所名校的博士学位[90],[91]

回到美国,在普林斯顿短暂任职后,汉森于1957年接受了当时正处在快速发展时期的印第安纳大学(Indiana University,简称IU)的聘任,任职哲学系。在IU工作的短短6年里,汉森继续着惊人的工作效率。在此期间,他完成了自己的代表性著作《发现的模式(Patterns of Discovery)》,在绝大多数科学哲学家都关注科学的证明情境的时代,是汉森挑战传统,独有创见,成为复活科学发现逻辑的孤胆英雄。而且在重重困难下[91],于1960年,在IU建立了美国历史上第一个科学史和科学哲学系(History and Philosophy of Science,简称HPS)。

图3-3 汉森于1961年的照片
(Courtesy:Indiana University Archives,本照片版权属于印第安那大学档
案馆,作者获得允许在这里使用该照片。感谢靳辉博士在IUB帮助联系。)

1963年之后,汉森去耶鲁大学任职。不幸的是,1967年汉森驾驶私人飞机飞行时却意外坠机而罹难,年仅43岁。这位才华横溢、勇敢善战的哲学英雄,正当事业的盛年,却突然过早殒世,实在令人扼腕叹息。1968年,著名的《波士顿科学哲学研究(Boston Studies in the Philosophy of Science)》出版了纪念汉森去世一周年的专刊,Vol.Ⅲ。在IU的HPS系互联网主页上,也赫然记载着汉森对这个系的创立所做出的贡献。IU的HPS作为美国历史上第一个科学史和科学哲学系,它的创立和近50年的发展,成功地实践着汉森分外强调的重视历史考察的科学哲学理念。

作为历史最长、同时也是美国最优秀的HPS系之一,IU的HPS系为美国科学哲学和科学史研究的发展和绵延,起着不可替代的作用。该系的毕业生遍布美国,甚至远至澳大利亚、加拿大、日本。2007年8月笔者在北京参加清华大学主办的第13届国际逻辑学、方法论和科学哲学大会(13CLMPS),期间就巧遇好几位曾在IU的HPS系获得博士学位的学者,其中,这届大会的主席、著名的认知科学哲学家格利莫尔(Clark Noren Glymour)是1969年在该系获得的博士学位。(2)韦尔斯校长与HPS以及IU的发展

在前述汉森创立HPS系的艰难过程中,时任校长韦尔斯(Herman B.Wells,1902~2000)的治学理念起着至关重要的推动作用。二战之后,美国的大学纷纷进入蓬勃发展时期。如何使位于美国中部的IU成为一所世界级水平的一流高等教育机构,面对东部数所已经颇有声望的老牌名校的压力,韦尔斯校长独辟蹊径,提出依赖发展与众不同的项目(unusual programs)来提高IU声望的办学理念。他说,“实践性和通俗性的课程自有其生存之道,我们要支持那些不为公众熟悉的、异乎寻常的并且不具有实践性的课程设置。[91]

汉森倡导的科学史和科学哲学领域正是这样一个新兴的交叉学科,在国内尚不为人所知,在这样一个新的研究领域进行的工作能够迅速产生影响,从而为学校赢得声望,这与韦尔斯校长促进IU脱颖而出的发展理念不谋而合。于是在校长的支持下,汉森的倡议最后得以克服种种困难,包括来自哲学系的坚决反对而最终实现。

在IU从1820年至今近两百年的发展历史中,第11任校长韦尔斯被公认为最杰出的校长。他36岁时就被委任为IU的校长,在担任校长的24年当中,IU成为了更大规模的世界级的高等教育研究机构,韦尔斯起着关键的发动机的作用。他的足迹曾遍及全美、欧洲,不远万里去各地招贤纳士,年仅33岁的汉森是众多被招募来的青年才俊之一,而还有两位著名学者尤其值得一提。

图3-4 金赛在对被调查者进行访谈
(图片来源:www.kinseyinstitute.org[2009-03-22])

金赛(Alfred Kinsey,1894~1956),这位由于对人的性行为的研究饱受指责和争议的生物学家,被聘到IU任职昆虫学和动物学教授。面对来自社会的巨大压力和激烈争议,韦尔斯校长始终如一地支持金赛的研究。因为,韦尔斯校长极力主张智识自由(intellectual freedom)和学术自由(academic freedom)之大学理念。在韦尔斯校长的支持下,1940年,金赛在IU创立了研究所,后来叫“性、性别和生殖问题研究所”,就是现在的“Kinsey Institute for Research in Sex,Gender,and Reproduction”。从1948年到1953年,该机构发表了两部关于人的性行为的研究著作,即人所熟知的《金赛报告(Kinsey Reports)》,成为美国当时最畅销的书。金赛对人类性行为的研究深刻地影响了美国和世界许多国家的社会与文化价值。

图3-5 金赛1949年在美国加州大学伯克利(UCB)演讲时的情景
(图片来源:www.kinseyinstitute.org[2009-03-22])

图3-6 金赛研究所现在位于Morrison Hall
(照片来源:庞秦山 王小红 摄于IU,2007年7月28日)

二战后期,韦尔斯校长颇有远见地引进了遗传学家马勒(Hermann J.Muller, 1890~1967)。马勒总是直率地表达自己的社会主义政治信仰,并与前苏联学术界有密切的联系,所以美国其它学术机构对此皆有所顾忌。1945年,马勒来IU任职,1946年就获得了诺贝尔生理学-医学奖,这大大促进了IU的生理学研究,并提升了IU的整体声望。这成为韦尔斯校长人才计划中的又一成功之举。

汉森、金赛、马勒等一批非常有创新思想的学者来到IU,给校园带来了新的活力和新的风尚,使IU的教学和科研呈现出生机勃勃的景象。汉森和马勒等人一同开设了主题为“达尔文及其进化思想”的学术讨论会,金赛和马勒等人在哲学系开设了一门新颖的课程,“从生命的视角看科学中的伟大人物”。1955年,科学史泰斗萨顿接受IU基金资助来IU进行了六次系列讲座,主题是文艺复兴时期的科学人物,萨顿的讲座大大促进了科学史在IU的为人所知。这些都为随后汉森创建HPS系打下了基础。

图3-7、3-8 Herman B.Wells校长纪念广场和纪念铜像
(照片来源:左,庞秦山王小红摄于IU,2007年7月26日;
右,en.wikipedia.org[2009-03-22])

韦尔斯校长远见卓识的办学理念、杰出的治校才能,还有他和善可亲的为人,对这所大学的发展产生着深远的影响。2006~2007年度,笔者有幸受富布莱特项目资助在IU访学,在美丽的布鲁名顿(Bloomington)校园学习和生活的一年中,时时处处都能亲身感受到这位前任校长延续至今的影响力。

他是历任18位校长中仅有的3位土生土长于印第安那州的校长之一,也毕业于IU,是一位深受IU人爱戴的地地道道的IU人。他曾担任IU凯利商学院(Kelley School of Business)院长,今天的凯利是美国顶尖商学院之一。

他在任期间,布鲁名顿校园增加了许多校园建筑,使大学的物理空间大大扩展。但是在快速扩展校园设施、增加教学和研究空间的同时,韦尔斯校长大力提倡保护环境。他强烈呼吁保留校园里的树木和绿地。他曾说,“砍掉一棵树就是一种背叛行动,是对前辈努力为我们保留下来的传统、忠诚和爱心的背叛。”这些保护环境的明智举措产生出显而易见的结果,现在的IU校园被公认为是全美最美丽的五个大学校园之一。

为了纪念这位杰出的校长,2005年,IU将主图书馆(Main Library)重新命名为Herman B Wells图书馆。

图3-9 IU以韦尔斯校长命名的主图书馆
(照片来源:庞秦山王小红摄于IU,2007年2月4日)

3.BACON程序体现的发现哲学

考察了汉森的发现的模式,再回头看声称自己深受汉森理论影响的西蒙的MD理论,我们会对BACON系统的设计思想及其方法论基础有更清晰的线索。

3.1 西蒙融合培根和汉森的实证主义方法论思想

我们认为,西蒙的发现理论是对汉森的溯因法和培根的归纳法的融合。我们无从知道汉森本人如果健在,会对这种融合赞许还是强烈反对。但是贯穿《发现的模式》的一条主线就是,汉森自始至终在表明,科学发现的模式既不是归纳式的也不是演绎式的。他是将归纳和演绎都作为与他所提倡的溯因法迥然不同的方法的。

但是西蒙在他的《科学发现有逻辑吗?》一文中指出,由于汉森没有给出一个关于溯因过程的清楚的逻辑形式,就“没有在心理学和逻辑之间划出明确界限”。也让H-D方法的信徒们把汉森的工作肤浅地看作是仅仅对心理学而不是对科学逻辑的贡献。因此,西蒙说他的这篇文章的目的就是要澄清溯因法的本质,并解释在什么意思上谈及“发现的逻辑”或“溯因的逻辑”[92]。西蒙在他的文章中究竟提出了一种怎样的发现的逻辑呢?我们简要说明如下:

考虑下述字母序列:

ABMCDMEFMGHMIJMKLM

MNMOPMQRMSTMUVMWXMYZMABMC…

我们只要在已经观察到的数据中找出了一种模式,就意味着我们发现

了定律。比如,上面的字母序列,经过考察,会发现一个规律:每三位的前两个字母根据字母顺序排列,第三个字母是“M”,可以把这种模式表示成:n(α)n(α)s(β);α=Z,

β=M

相应再附以规则的说明。

显然,西蒙的发现逻辑就是一种归纳方法。但是西蒙强调他的发现逻辑仅仅意味着:在已经观察的数据中找出模式;模式是否继续适合于随后被观察的新数据,这将不属于发现的逻辑,而是证明的逻辑。所以,西蒙认为他以这种方式解决了“归纳问题”的困扰。无独有偶,在现代归纳逻辑发展中,也有哲学家采用这种“不用真正的全称命题作为确证的候选者,而选择限定的概括命题”来避免归纳问题。如玛丽·赫西(Marry Hesse)所做的,她并不把一个需要归纳证实的科学假说设想为一个不加约束的对象域上的全称命题,相反,她认为科学假说具有这样的形式,即“在有限的时空区间内的所有后继的n个P是Q”[93]

西蒙是将汉森在提出可能性假说的最初阶段对事实和数据的重视,体现在培根的归纳方法之中,这就是西蒙的融合。这种融合一方面提取出分别提倡归纳和溯因方法的科学哲学家思想中,强调实验和事实对科学发现的基础作用的实证主义色彩。但另一方面,这种融合也混淆了汉森的溯因法和培根的归纳法的根本区别。溯因法提出假说虽然以观察事实为基础,但在已有观察的事实中,假说的发生概率极低,近乎0;而归纳法得出的一般性概括,它的已有发生概率较高,如果在西蒙的例子中,是一种完全归纳,其得出概括的发生概率达到最大值1。这样比较之后我们看出,溯因法的确在提出“新”假说的创造性意义上,比归纳方法具有更大的价值。但是,虽然汉森说,提出“新”假说要基于已有事实,却没有给出更具操作性的细节步骤。所以,有人用心理学途径来填补这个“空缺”,而西蒙则用完全归纳。BACON程序找出开普勒或波义耳使用过的原始数据中的模式,正是基于西蒙的这种设计思想。

3.2 BACON系统数据驱动设计思想的方法论基础

首先,BACON系统的数据驱动设计思想得益于汉森的实证论发现观的启发。汉森虽然不认为科学定律的发现是从归纳得出的,但他还是肯定了归纳在这方面的尝试,不像H-D方法完全把发现推给心理学。汉森反复强调数据、事实或现象的基础性作用,对提出假说的指引作用。他说,人们是溯因式地考察现象P,把它“扔”进一个可理解的模式里,通过提出假说H使现象P得到解释。但是,“是P控制着H,而不是相反。推断是从数据到假说和理论,而不是相反[85]。”汉森反复强调的观察事实对假说的“控制”,使西蒙产生共鸣。而且汉森选择的开普勒的例子(典型的在先被给予的数据条件下做出发现的例子),最能说明汉森的观点“从数据到假说和理论”的推断顺序,同时,也启发西蒙在现有AI技术条件下设计数据驱动发现程序BACON。我们知道BACON的最早版本的启发式是针对发现波义耳定律、开普勒定律而设计的。

此外,BACON系统对科学发现进行理性重建,这种理性的科学发现观吸取了汉森和库恩的科学发现理论中的历史主义“养料”。汉森虽然探讨创造性的科学思想是怎样产生的,但是,对物理学史的考察使他更坚信科学的一贯性特征,从早期到现代的物理学解释是“一贯的、接近的和规则上继承的”。

粗一看,似乎科学史中发生了一种量子跳跃。1901年、1905年、1911年、1913年、1915年以及1924年~1930年的概念爆发,显出物理学已经从法拉第和开尔文(Lord Kelvin,1824~1907)的小心的、累积的、实验性学科转变成更具猜想性的、不规则的,甚至是令人震惊的事情。像,坦纳里(Paul Tannery,1843~1940)、迪昂(Pierre Duhem,1861~1916)、萨顿(George Sarton,1884~1956)这样的历史学家教我们看到突然的中断,爱因斯坦、玻尔(Niles Bohr,1885~1962)、海森堡(Werner Heisenberg,1901~1976)和狄拉克(Paul Adrien Maurice Dirac,1902~1984)是与开普勒、伽利略和牛顿不同类的思想家。但这是错的。他们都是物理学家:也就是说,他们都是寻求对现象的解释的自然哲学家,在这一点的相似性比“经典-现代”的二元划分使科学哲学家们想到的差异性更多[85]

在这一点上,汉森同库恩相同,都将科学发现看成是一个过程,有时甚至是十分漫长的时期。汉森特别举出伽利略在自信地找到了等加速度假说之前,奋斗了34年的例子。而且,汉森认为科学研究过程中具有创造性的工作就是提出假说的过程,一旦假说提出后,接受检验以至于经过更精致的建构形成一个H-D体系的过程,都是常规解题式的工作了,“等加速度假说以后的工作只要伽利略的任何学生完成就行了”。

汉森认为科学是一贯性的事业,既为他提出发现是有逻辑途径的,发现是可以进行理性重建的观点提供支持,也为西蒙发展汉森的工作,将发现的逻辑进行可操作性的重建提供理由。这个观点以及前面我们分析过的,库恩强调常规科学的解题工作对科学的贡献,促使西蒙提出“科学发现就是解题”的发现理论。

3.3 西蒙和汉森的分歧

但是我们又看到,在西蒙发现思想指引下开发出的BACON程序,其具体的发现方式同汉森提倡的发现理论是有分歧的。汉森认为,自然科学不能等同于数学,自然科学寻找的是对数据的解释,是数据背后的意义而不是纯粹数学函数关系。所以汉森在考察史料时,虽然认为数学推演是必要的,但他特别强调每当发现一个数学模式时,阐发其中包含的物理学意义的重要性。他高度评价开普勒采用当时并未流行的日心说,甚至说开普勒提出的“太阳可能以某种方式引起行星的运动”是一个超过了哥白尼的思考的伟大猜想。汉森还评价开普勒提出“研究地球的轨道”是另一个创见,因为在当时地心说的时代这是没有人考虑的(包括哥白尼)。汉森尤其提醒我们重视开普勒对椭圆轨道的考虑所蕴涵的重大理论意义,他说:

事后聪明使我们低估了古人座右铭的力量;开普勒的挑战对我们来说似乎很自然。但是不可能再有更大胆的想象力了:开普勒竟然敢把一直以来的天文学模式推开。即使是我们这个世纪的自然科学也没有那样对过去进行如此破坏力的概念颠覆。在开普勒之前,圆运动之于行星概念,就如同“确实性”之于我们的“物理客体”概念。如果我们难以想象物理客体是不可把握的,那么,非圆行星轨道对开普勒的前辈以及开普勒的同时代人也同样是难以想象的[85]

同样,他还剖析了伽利略发现中的物理学意义。称伽利略考虑落体的速度不是与距离(在常识看来是更明显的),而是与降落的时间(v∝t这种关系在当时并不是那么“自然”)成正比是具有现代物理学意义的事件,“这是朝着现代情形迈出的一步”。

我们仔细研究了汉森的发现理论之后就会清楚地感觉到,BACON程序太简化了。它直接被给予了椭圆轨道假说,而且缺乏对所发现的数据模式进行物理学或化学等方面理论意义的解释。如果BACON的发现任务再设计得复杂一些,让它自己根据数据确定轨道的几何形状,就更有说服力了。这应该对于启发式技术来说不是难事,孔宪中的书中就考虑了类似的启发式,完全可以用在程序中。但可能在西蒙他们看来,那样做不太必要,因为西蒙他们本质上还是为了AI的目的,他们设计数据驱动启发式对KDD、DM、ML等实用AI技术具有基础性作用。这也就是认知学者们批评西蒙的MD程序没有心智模型的缘故吧。

3.4 西蒙与劳丹在实用主义发现观方面的契合

我们的考察得出了一个意外的结论:西蒙的发现理论与劳丹的科学哲学理论在许多方面更为契合。最为契合的一点就是,他们都认为科学发现就是解题。

科学理论评价标准这个科学哲学的核心问题,从逻辑经验主义的证实,到批判理性主义的证伪,都是强实证标准,但是到历史主义的弱实证标准,再到费耶阿本得的“无”标准,到新历史主义提出“新”标准,几经嬗变之后,在劳丹那里,已经将科学理论的评价标准指定为能否有效地解决问题的实用性标准。劳丹在他的《进步及其问题》中试图论证的一个主要观点就是:解决问题是科学唯一最一般的认识目的。对于有人指责他的观点是工具主义的,劳丹则阐述他的实用主义的实证论立场,“解题模型使我们能够表明,尽管任何理论很可能为假,但科学仍是一项值得追求的极富思想意义的事业。……这一模型丝毫不排除科学理论为真的可能性;也不排除随着时间的推移,科学知识越来越接近真理[94]。”

与此同时我们看到,西蒙也提出了几乎同出一辙的机器发现理论。而且,西蒙也同样对科学的认识目的持“现实主义”(西蒙自己的用语)或者说实用主义和实证论的立场。他认为,科学发现的任务就是创造能“足够好(well enough)”地解释观察事实的理论,而不是最好或最优(optimal)的理论。可以寄希望于明天的理论能解释得更好。如果一种发现理论放弃了不可能获得的有完全保证的成功,那么,这种发现理论就变成了一种专门的关于启发式搜索解题的问题了[44]

西蒙运用信息加工心理学考察人类思维过程,得到了一系列对研究人的认知颇有启发意义的假说。除了我们已经详细阐述的启发式搜索解题假说之外,还提出了“有限理性假说”。人们都熟知西蒙这个假说对经济管理学中的决策理论曾经做出重要贡献。但是,人们知道不多的是,西蒙同样将这个假说用于解释人类进行的科学认知活动,从而提出了他上述的“足够好”而非“最好”的现实主义认识目的。而且,西蒙提出这种实用主义的发现理论是清醒地看到当代的认识论背景:从19世纪可错论替代不可错论成为主流认识论,到20世纪由于哥德尔的工作还有物理学中出现的量子力学新范式,使得逻辑和形式化的公理系统都不得不屈服于非决定性和不完备性,由此,可错论、反基础主义的基础更加牢固了。

让我们再来看看二人发现观上的另外一个契合之处。我们前面曾分析过,西蒙的“发现就是解题”理论是深受库恩理论影响的,但是令我们困惑的是,他提出的“革命科学和常规科学没有定性的不同”的观点却怎么也难与库恩理论相吻合。在这里似乎有了答案:如果说西蒙将革命科学和常规科学等同起来,是对库恩的一种有意“误读”,那么,这种“误读”劳丹一定欢迎(因为他们都主张科学发现就是解题)。

劳丹虽然承认科学革命作为一种重要历史现象的存在,但是他批评库恩的区分是对科学革命与常态科学之间差异的夸大处理。他认为,有许多证据表明,科学革命并不像库恩所说的那样革命,常规科学也不像库恩所说的那样常规。库恩忽视了科学的一个重要特征,即任何一个范式都极少能如库恩对“常规科学”所要求的那样,在该领域占据霸主地位。很难找到任何科学学科中一个研究传统或范式独自存在一长段时期(即使十年左右)的例子[94]

此外,西蒙的发现逻辑体现了劳丹曾经总结的研究发现逻辑的另一个次要目的,即实用性目的。在可错论的时代,传统中研究科学发现逻辑的认识论目标已经无可挽回地失落了。但是,传统中居于次要位置的实用目的在当代复兴科学发现逻辑的计划中却彰显出来。现在的发现逻辑并不能保证得到真理,但是可以保证提高做出发现的效率。

不过奇怪的是,纵然西蒙与劳丹的科学发现理论有这么明显的相似之处,我们却没有找到西蒙承认受到后者影响的任何只字片语,劳丹也没有表现出对AI以及其中的MD研究的关注热情。反之,劳丹可能对类似机器发现这样一种研究科学发现的进路并不欣赏。

劳丹在考察完科学发现逻辑衰落的历史进程之后,曾向复兴发现逻辑的计划提出了挑战:为什么应该复兴发现的逻辑?之所以提出这个质询是因为,劳丹对研究科学发现逻辑的实用主义目的持一种矛盾的态度。本来按照他的“科学的目的就是解题”观点,自然应当承认这种实用性的提高解题效率的目的。他也做出了这方面的强调,认为:有一种关于科学的启发式问题,即怎样以最大的速度产生新的有前途的理论。并且他明确表示,后验的证明逻辑对此没有贡献,也绝对不能满足为发现逻辑设计启发式的任务。但是另一方面,他又很怀疑提高解题效率的启发式问题是否应该是哲学家考虑的问题。他类比说,“艺术哲学家不会以哲学家的身份来关心怎样从一块花岗岩上砍凿出一件雕塑;法律哲学家也不会关心起草一项法案的机理。同理,控制发明理论技术的规则(如果有那样的规则),是哲学家应当投以兴趣及能力的事情吗?这还是个问题[1]。”

我们以为,劳丹的这个疑虑是将生成理论与生成技术上的人工品做类比,由此说明关心生产机理没有哲学价值,他的理由有些牵强。其实这是两类不同的人工制品。生成理论主要靠思维的创造,而后者主要靠在人的巧思支配下的工具纯机械性的创造,以及在已经创造出规则之后的平凡的“程序活儿”。但是,创造性新思想是如何产生的,大脑中“生产”理论的机理却远未清楚,这种探索本身就是极具开拓性的事业,人类所有学科不都是诞生于哲学这个母体吗?那么,现在探索心智这项开拓性事业必定少不了哲学思考。

4.复兴科学发现逻辑的理由

20世纪50-70年代科学哲学的背景可能为复兴发现的逻辑暗示了一个“通途”。在这期间,由于比埃尔·迪昂和威拉德·奎因(Willard Van Orman Quine,1908~2000)的相互承继的贡献,迪昂-奎因命题(即不完全决定性命题,underdetermination)已经被广泛接受作为理论检验的主流解释。这样一来,虽然波普尔指出了归纳逻辑的一个“瘫痪”:任何全称命题其发生的概率都是0,然而,他却没有料到他所提倡的演绎检验也同样面临一个逻辑“瘫痪”,即,如果要用实验检验一个理论,涉及的陈述比组成受检理论的那些陈述更多,以至于证伪一个所谓单称命题也不容易,甚至“强”意义上的证伪同证实一样不可能。于是在这种时候,许多哲学家逐渐在怀疑中反思,一直以来的逻辑分析在多大程度上阐明了科学的本质,而一直以来被排除在逻辑分析之外的现象如科学发现难道不应该重新进行逻辑考察吗?

这样,科学哲学家从两位发现逻辑开拓者的复兴计划中,从科学哲学对科学史的关注中,似乎已经找到了复兴科学发现逻辑的理由,那就是:发现的过程含义、逻辑的广义含义、两种前后关系的区分不合理以及时代背景四个方面的理由。

首先,如果发现就是指“啊哈”时刻,那么这样的发现定义因为太简略,将遗漏历史上绝大多数重要科学发现。科学发现分别有事实的发现、经验定律的发现、理论的发现。库恩对科学史的考察表明,科学史中的发现很少是一个能确切指明做出发现的人、做出发现的时间和地点的单独事件[95]

其次,逻辑的含义在这里指广义的含义,即理性的或合理的意思。说科学发现逻辑就是指一种方法、一个总战略,也可以具体为一套程序、一套规则。

皮尔斯和汉森的发现理论已经表明,提出“似然性”假说要基于事实,实际上是先基于已有事实提出猜想,使猜想去符合事实,如果不符合,就重新提出猜想或修正原来的猜想。汉森考察,伽利略在寻找等加速度假说的34年中,不断修正以及提出新的假说,而每次修正或提出新假说,“都不是随意地”,那就是不断用观察事实检验。所以,发现的前后关系是有理性途径的,而且在得到满意假说之前的探求满意假说的过程,是一个发现的前后关系和证明的前后关系交错在一起的过程。

西蒙的机器发现理论也对两种前后关系的区分进行了否定,认为来自经验观察的事例说明:

发现和证明不是相互独立的活动,前者虽然在后者开始之前就完成了,但是从探索一开始二者就紧密混合在一起。发现通常需要一个长时间的、一步一步的搜索过程,而且搜索的中间产物要被反复检验,以便确证或否证它们是否是解决问题的方案,而更重要的是,通过检验获得新的信息指导后续的搜索[44]

尼克尔斯总结出人们对发现和证明的区分主要是逻辑的区分,和时间上的区分。我们认为,把发现完全等同于不可捉摸的、黑箱中的过程,从而将发现和证明进行逻辑区分,不可能做到。而在时间上将两种科学研究的环节完全隔离也违背科学研究的历史。

最后,我们看看20世纪70年代以来,探讨“发现的哲学”的大背景:如果说,19世纪末皮尔斯研究科学发现逻辑尚属“孤掌难鸣”,半个世纪之后的汉森也依然是单刀匹马地行进在科学发现逻辑路途上的“独行侠”,那么70年代以来,复兴“发现的哲学”已经成为认知的时代一个呼之欲出的共识。

现有资料表明,最早一次复兴发现逻辑的活动在1973年的春天。当时,由美国史密森学会(Smithsonian)、美国国家科学院以及哥白尼学会共同举行了一场盛大的哥白尼诞辰500周年庆典,地点在华盛顿。而这次庆典活动的主题就是“科学发现的本质”。会议上,著名科学史家霍尔顿(Gerald Holton)提交论文“科学发现的主要动因”,他建议:

至少,我们要自问一下,是什么条件有利于巩固科学,什么条件削弱科学。我想远远避开诸如经费、人力、科学的政治学等等那些已经被充分讨论过也值得讨论的主题。我关注科学工作从前的中心问题,就是科学发现过程的本质[89]

随后是1977年,意大利埃尼切(Erice)举行的两年一次国际科学史学院课程。来自世界各地的史学、认识论和科学的研究者,就科学发现做了逻辑、心理学、文化和社会诸层面的批评性考察:米尔科·D·格尔梅克(Mirko D.Grmek)呼吁让科学发现史逃离神话之境[96];马尔切洛·佩拉(Marcello Pera)深入论证归纳法就是科学发现的方法,并驳斥流行的反归纳法理由之谬误[96]

1978年,国际科学哲学界召开第一届纪念伦纳德(Guy L.Leonard)哲学讨论会,会议主题就是科学发现。国际科学哲学界普遍认为此次会议标志着科学哲学研究发生重要转向:从此,发现、创新和问题解决将取得合法的研究领域的地位,大多数科学哲学家不再把发现认为是专属于心理学、社会学和史学的研究领域。尼克尔斯总结说:“现在对历史个案的研究使许多哲学家意识到这个事实:忽视发现、创新和问题解决在一般意义上就是将科学家所进行的活动与所关心的问题的绝大部分给忽略掉了,而这些不仅仅是科学研究中最令人感兴趣的部分,也是(更重要地)与认识论高度相关的[81]。”

当代重视发现方法研究的哲学家,他们既反对把方法论等同于算法意义上的狭义逻辑,也否认培根、波义耳等传统意义的发现逻辑的存在,他们的口号是:“没有发现逻辑的发现方法论!”古廷(G.Gutting)把这些哲学家称为“发现之友”[81]

在当今可错主义认识论主导的时代,劳丹完全可以不必怀疑这个实用目的的理由,即科学发现逻辑就关注关于科学的启发式问题,关心怎样以最大速率产生新的有发展前途的理论。另有一些主张复兴“发现的哲学”的研究者认为,一种发现的方法论本身就包含具备重要认识论意义的关于问题解决和启发式的理论,而不用将研究“发现的哲学”的理由诉诸于对理论证明及合理性的作用;还有人提出,发现方法论的一个任务就是去开发解决问题的方法以及比盲目猜想更有效率地获得新思想的方法。

在这里,我们也找到了科学哲学界高度评价西蒙等AI科学家对发现理论的贡献的原因。因为,科学哲学家们认为的理由早已经被西蒙等AI科学家从技术上进行了初步探讨。比如,BACON模拟人类寻找数据规律的启发式,以及尝试提出新的术语的启发式。

而且,当代哲学界对AI以及西蒙的研究引发的哲学问题非常重视,哈佛大学哲学系开设“哲学的启发式”课程(即Philosophical Heuristics)。课程目标是:通过考察一般认知启发力,考察历史与当代的特殊哲学文献,为哲学思维与理论建造发展出非机械性的启发力。其指定阅读文献就有纽厄尔和西蒙的经典AI著作《Human Problem Solving》,以及西蒙的《Models of Discovery》[97]

第3节 机器发现与科学家发现的不同

BACON作为近20年最成功的MD程序之一,对科学发现逻辑的事业具有重要的意义。但是将其与真实科学家的发现过程做比较,就让我们清楚地看到科学发现的计算机模拟这一新的研究领域还有许多尚待解决的问题。

概括来讲,虽然BACON是对科学家进行科学发现的模拟,但BACON同真实的科学家的发现只在发现结果上是相同的,而具体的发现过程和发现方法却有着很大差别。

首先,BACON系统模拟重新发现科学定律的过程,比之真实的发现过程,所要解决难题的难度已被降低。BACON对开普勒定律的再发现,有两个前提,一个是程序开发者事先限定它考虑的变量是2个,D和P,而对D和P关系的考虑正是开普勒的一大创新。因为在当时托勒密天文学为主导范式,D,即行星距太阳的平均距离是没有意义的,通常没有科学家考虑这个值。第二个前提是,程序开发者给BACON设计的启发式,限定所搜索的定律的形式是xmyn=常数,寻找这种形式的定律是开普勒的另外一大创新[18]

因此,BACON对定律的再发现比之科学家本人的再发现所要解决难题的难度是大大降低了,BACON已被告知了科学家由于自己的创造性思维获得的重要假定(通过析因设计产生式),这样BACON再发现开普勒定律的难题被降低为从给定数据中找出两个参数间的数学关系的问题,这对计算机来说是非常简单的事情。

此外,BACON的设计者清楚地知道,BACON还远远不具备处理现实情况下数据干扰的能力。抗干扰问题是设计者在BACON的系列版本时,不断改进的一个目标。

再者,BACON不能像科学家那样将发现的量的关系解释为新的定律,其输出还必须由人来解释。也正因为这样,BACON目前只能发现定量的描述性的定律,远不能像科学家那样发现定性的解释性定律。但这一点在别的机器发现系统身上已有所突破。

另外,阿瑟·米勒(Arthur I.Miller)认为[17],尽管个人癖性对一个解决难题的计算机模拟程序来说,或许不重要,但它们却时常参与一个科学家对一个难题的感知系统的建构,很多时候,一个解决方案的产生正是由于这些方面的概念发生转换的结果。米勒还认为计算机的发现过程不能再现美感,而美感是创造性思维的一个重要维度。很多科学家在回想他们的重要发现过程或方法时,都无法用语言说清楚那个重要想法产生的细节,而诉诸于这种特殊的美,宇宙的和谐,这些因素促使他们选择了最能描述这种和谐性的方法。

虽然我们列举了BACON与科学家在发现过程中的不同之处,但我们都知道,开发BACON并不是要在细节上模拟人的发现过程。而正是因为通过与人不同的计算发现,我们才可以发现通往科学发现的不同的途径—计算发现途径。对科学定律的计算发现还处于探索阶段,迄今为止,计算机程序尚未做出任何人类不知道的科学发现,但是正如戴维·兰博(David Lamb)所认为的[17],“在发现别人知道的事情和发现这个世界中的新的事情之间并没有尖锐的分界线。”我们相信,BACON以及任何别的发现程序被设计的目的,都不是为了真实重现科学家本人进行发现的思维过程,而是在限定意义上发挥人工智能的作用,提出科学发现也许是如何发生的理性模型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈