二、科学理论的实践检验与评价标准
1.实践检验
实践检验是通过观察和实验对理论假说及其推论进行的验证。理论假说中包括有对事物本质的猜测,这种猜测往往以全称判断的形式出现,具有抽象性和普遍性,因而是无法直接验证的。因此,需要由理论假说中演绎出若干可以直接检验的推论,然后和观察实验结果进行对照。例如,对电磁理论中“电磁波和光波具有同一性”的普遍性命题无法进行直接检验,但可以由它演绎出许多能够直接检验的推论。比如,如果电磁波与光波具有同一性,则电磁波的速度应等于光速。这个结论在1888年由物理学家H·R·赫兹所确证。在一个有限空间里,难以直接测量电磁波的速度,赫兹用检波器测量出电磁波两个波节之间的长度,即半波长,然后根据振荡器的频率公式计算出电磁驻波频率,最终计算出电磁波的速度,从而肯定了电磁波速等于光速的结论。但这一实验测量的结果并不等于完成了电磁波与光波具有同一性的证明。因为两者具有同一性意味着电磁波应显示光波的所有性质。H·R·赫兹接着进行了关于电磁波的反射、聚焦、折射、偏振等多种实验,证明了电磁波具有当时人们所认识的、光所具有的各种物理特性,这样H·R·赫兹才算完成了电磁波和光波具有同一性的实验实证。
即使是理论假说中所包括的预言和预见,也并不总是可以直接检验的。对这些预言和预见也需要演绎出若干推论和实践结果进行对照。比如,因为引力波很弱,目前还没有仪器能直接观测,所以对与广义相对论有关的引力波的检验,目前只能通过对引力波存在的某些特有效应来间接进行。例如,引力辐射会引起双星运行周期的变化。1978年美国天文学家J·H·泰勒小组宣布他们通过对高速旋转的致密双星的四年观测,测得双星转动周期缩短了万分之四秒,与广义相对论的引力波理论计算结果相一致,从而探测到了引力波的一个间接效应。
2.可证实性:证实论、确证论与“确证度”评价
可证实性(verifiability),即逻辑经验主义的经验证实理论。20世纪20年代由奥地利科学哲学家L·维特根斯坦首先提出。他在1922年出版的《逻辑哲学论》一书中指出,一个命题要成为有意义的,必须具备两个条件:其一,命题必须符合语言的逻辑,“我们不能思想非逻辑的东西”(15),而要做到这一点,人们在使用语言上就必须符合逻辑、符合语言的语法规则和逻辑规则;其二,命题要与它所描述的事态的存在或不存在相一致,换言之,命题的意义还要取决于命题与事态的联系,取决于命题是否代表了所描述的事态。他说:“实在是与命题相比较的”;“命题只因为是实在的图像,才能为真或者为假”(16)。命题的真假取决于它所肯定的事实存在或不存在。L·维特根斯坦还提出他的意义标准,即意义的可证实性。在他看来,对于有意义的命题,总是可能找出一种可以证实这个命题或真或假的方法。他说,“有意义的命题陈述某件事情,它的证明则表明确是如此。在逻辑中每个命题都是一种证明的形式”;“逻辑始终可以这样来理解,每一个逻辑命题都是它自身的证明”(17)。于是,在他那里,意义的可证实性成了意义的标准,也就是说,只有可证实的命题才是有意义的。
1936年,德国科学哲学家M·石里克在“意义与证实”一文中进一步说明了“什么是可证实性”。他的说明有三点:(a)可证实性是逻辑经验主义关于命题的意义标准,“只有可证实的命题才有意义。”(18)(b)所谓“可证实性”,是指证实的可能性,并不意味着当即可以证实。他把证实区分为两类:完全证实与可能证实。所谓完全证实,是说无论从逻辑上还是经验上,都要求做出明确无误、确凿无疑的说明。事实上这是根本办不到的。因此,我们的证实并不是这种完全的证实,而是一种证实的可能性,或者说是一种“可证实性”。也就是说,“可以证实”并不意味着“在此时此地可以证实”,更不意味着“现在得到证实”(19)。一句话:“可证实性的意思就是证实的可能性。”(20)(c)“可证实性”可区分为“经验的可能性”和“逻辑的可能性”。“经验的可能性”是指同自然规律不矛盾,或者说“同自然规律相容”(21);而“逻辑的可能性”是一种“符合我们语言制定的语言规则的”可能性(22)。“可证实性是意义的充足而必要的条件,是一种逻辑的可能性。”(23)如果一个命题具有经验证实的可能性,或者可以通过对命题的逻辑分析而使之与直接经验陈述具有可推导的关系,那么这个命题就可以归属于科学的领域;反之,如果一个命题不是经验命题,不具有可证实性,那么就不能归属于科学的领域。
逻辑经验主义所提出的可证实性的意义标准,向人们揭示了依据经验评价科学理论的原理,亦即评价科学理论,实际上是评价其作为概念体系的理论知识部分,其价值就在于容纳经验知识。它说明:“理论体系的结构是理性的产品;经验内容及其相互关系都必须在理论的结论中表示出来。整个体系,特别是那些作为它的基础的概念和基本原理,其惟一价值和根据,就在于这种表示的可能性。”(24)但是,这一标准在运用时有两大困难。其一,有限的经验不能证实普遍的理论陈述,用归纳法证实不了科学理论。科学命题和科学定律总是全称陈述,经验的单称陈述的真不能传递到全称陈述上。其二,有时候经验会欺骗人,给人造成错觉,例如,比较C·托勒密的“地心说”与N·哥白尼的“日心说”可知,“地心说”与人们的日常经验更相符合,倘若仅仅根据经验,人们就会选择“地心说”而拒斥“日心说”了。
鉴于证实论遭到困难,R·卡尔纳普于20世纪30年代提出用确证论来取代证实论。他在“可检验性和意义”一文中指出,“确证”(verification)不同于“证实”(verification),“如果证实的意思是决定性地、最后地确定为真,那么我们将会看到,从来没有任何(综合)语句是可证实的。我们只能够越来越确实地确证一个语句。因此,我们谈的将是确证的问题而不是证实的问题”(25)。这就是说,对一个理论假说的“证实”,就表明这个理论是真的,而且永远正确,而对一个理论假说的“确证”,只是现阶段得到确定,并不保证以后也确定。换言之,“证实”不仅是对理论的过去的评价,也是理论的现实和将来的评价;而“确证”只是对理论的过去的评价,它对于这个理论的未来什么也没有说。
与此同时,逻辑经验主义者还对合理性接受的原则作出了明确的表述,即建立了所谓确证逻辑或概率归纳逻辑。他们认为,虽然理论假说不可证明,但至少可以“部分得到证明”或“(被事实)确证到一定的程度”;这种“证据支持的程度”或“确证度”在一定程度上等于概率计算意义上的概率。H·赖辛巴赫首先提出用概率的方法对理论进行评价,以达到部分证实的目的。他指出:“归纳推论的研究属于概率理论范围内,因为可观察事实只能使一个理论具有概率的正确性,而永远不能使一个理论绝对确定。”(26)他主张“概率的意义理论”,认为命题除了具有意义和真值之外,还有权重(weight),即关于陈述内容的可靠程度的由小到大的度量系列;概率就是对权重的精确计量。1950年,R·卡尔纳普则在其出版的《概率的逻辑基础》一书中从他的概率归纳逻辑导出了“确证度”概念和评价方法。他说:“概率的逻辑概念应当给经验科学方法论中一个基本概率,也即对关于特定证据的假说进行确认的概率,提供一种精确的数量说明。”(27)R·卡尔纳普认为,一个证据e对于理论假说h所提供的归纳支持,能够用一个具有概率的形式特征的精确定量公式c(h,e)=r来表示。这一公式的意义是,理论假说h对于证据e而言的确证度c的值是r。比如,对于“乌鸦是黑的”这一假设,如果观察到999只乌鸦都是黑的,只有一只乌鸦的颜色不能确定,那么,这一假设的确证度为99.9%。
逻辑经验主义从谋求一种经验事实对命题的完全证实即强的证实到只要求对命题的部分证实即弱的证实,用确证来代替证实,用概率的真来代替完全的真,这一“战略性”的退却,既反映了他们的实证原则所遇到的困难,也表明了他们对科学知识的确证性以及这种确证性的合理性标准的执著追求。按照R·卡尔纳普的概率归纳逻辑解决确证问题,对于克服传统归纳法中的一个简单化观点也是有益的。但是,与迄今为止的任何类型归纳逻辑一样,它实际上根本解决不了如何定量这个关键问题,并且还存在着两个致命的弱点:第一,它把任何个别证据对理论假说的支持程度都看作是相同的、等价的,实际上不同的证据给予同一理论假说的支持程度是很不相同的;第二,检验证据的单称命题对科学理论的全称命题的支持程度,其逻辑概率等于零。依据概率逻辑,当支持普遍的科学定律的单称陈述的数量增加时,它的逻辑概率也就增加。但是,任何观察证据都是由有限数目的观察陈述组成的,而理论的全称陈述却涉及对无限数目的可能事实的断定。所以,其概率就等于以有限数除以无限数,这样不管构成证据的观察陈述的数量增加到多少,其概率仍然是零。
我们应当从证据的量与质的结合入手来研究确证证据对于理论的支持程度。一批给定的证据对理论的支持强度取决于证据的多种不同特征,在评价理论的所谓科学上的可接受性或可信性时,需要考虑的最重要的因素有:“所取得的相关证据的广泛程度,证据的性质以及这些证据给予理论的支持所达到的强度。”(28)一个理论假说建立之后,人们总是千方百计地去搜寻能够对其提供支持的确证证据,并且愈多愈好。因为证据愈多就愈能说明理论假说的普遍有效性。如果一个理论在原有证据的基础上又增加了类似的证据,那么它的确证度将随之提高。这就是所谓证据的广泛性或证据的量的作用。例如,每发现一个新的造父变星,其周期与发光度符合莱维特-沙普利定律,那就会被认为是增加了对该定律的确认。但是,不应由此而认为各个确证证据都是等价的,都对理论提供同等程度的支持。C·G·亨普尔指出:“由每个新的有利实例所造成的确认度的增加一般将随着已确立的有利实例的数量的增大而减小。”(29)譬如,人们会问:为什么E·哈雷成功地预见哈雷彗星回归的日期对于牛顿引力理论的支持程度,与人们日常看到抛起的一块石头掉向地心这一现象对牛顿引力理论的支持程度是如此的不同呢?为什么H·R·赫兹根据麦克斯韦方程式的预测,通过实验首次确证电磁波的存在,与今天人们收看电视节目时确证电磁波的存在却大不相同呢?在这里,C·G·亨普尔实际上是在证据的量的支持力中引进了一种关于重复证据的次序的“权”,从而开始了从量到质的转化。从次序的“权”考虑,重复证据的次序愈靠前,对理论的支持力就愈大;愈往后,对理论的支持力就愈小。“如果已经有了成千上万的确认性事例,再增加一个有利的发现只会使确证度提高很小的一点点。”(30)
理论假说的确认不仅取决于所取得的有利证据的数量,而且还取决于该证据的多样性,即种类越是多样,给予的支持就越强。这就是事例的多样性原则。举一个简单的例子来说,假定所考察的假说是斯涅耳定律,该定律陈述说,一束光线从一种光学媒质倾斜地穿入另一种光学媒质而在分界面上形成折射时,入射角与折射角的正弦之比,即sin α/sinβ,对给定的两种媒质而言在任何情况下均保持为常量。试比较下述三组检验,每组均进行100次:第一组,媒质与入射角均保持不变,在每次实验中光线均以30度的入射角由空气进入水中,对折射角进行测量,结果在所有情况下sin αβ具有相同的值;第二组,媒质保持不变,但对入射角α加以变化,光线以不同的角度从空气进入水中,对折射角进行测量,结果同样发现在所有情况下sin αβ具有相同的值;第三组,媒质与入射角都给以变化,考察25对不同的媒质组合,对每一媒质组合采用4种不同的入射角α,结果发现每对媒质组合中4个与之相联系的比值sin α/sinβ均相等,而与其他不同的媒质组合相联系的比值则不具有此值。在上述三组不同的检验中,每个检验组都代表了一个有利结果的集合,因为检验结果表明,与每个特定的媒质组合(譬如空气与水、空气与酒精等)相联系的比值均相等,这与斯涅耳定律一致。但是,由于第三组提供了最为多样化的正面实例,可以认为它对斯涅耳定律的支持力最强,第二组次之,第一组则为最弱。
规定确证证据的另一个要素是证据的精确性。从这方面来说,一个精确性程度较高的证据比起一个精确性程度较低的证据来,能使科学理论获得较高的评价。证据的精确性程度取决于确证证据是怎样得到的,归根结底依赖于取得这个证据的科学实践水平,依赖于观察和实验的严密性程度。作为检验的观察和实验愈是严密的,则由此产生的确证事例的价值和意义就愈大,从而这个证据的质量就愈高,也就能使理论得到更高的评价。例如,对于惯性质量与引力质量的同一性假设,有一种支持就来自下述结果:不同化学组成的物体在自由下落时其加速度相等。近年来用极为精密的方法对这一假设又进行了检查,迄今为止,其结果仍然与该假设相符合,从而极大加强了对该假设的确认度(31)。从证据的精确性看,对理论确证度的提高有帮助的主要不是取决于实验次数的多少,而是取决于实验的严密性如何,从而是否能提供出更为精确的证据来。
证据的质还通过证据的新颖性表现出来。“对科学假说来说,如果它能同时被‘新的’证据——那些在构写假说时我们本来并不知道或并没有考虑到的事实——所确认,那就是最合乎希望的。自然科学中有许多假说和理论的确都取得了这类‘新的’现象的支持,其结果是对它们的确认度大大地增强了。”(32)所谓证据的新颖性,实际上主要是对理论作出“严峻检验”的经验证据;而“严峻检验”则是指对理论的大胆新颖预测的检验。如果被检验理论作出的逻辑推断在常识看来是不可信的,则该预测就愈是大胆的、新颖的,因而对它的检验也就是严峻的。换句话说,倘若某个预测从背景知识是推导不出来的,而特别使人感到离奇地与常理相悖的,那么对它的检验就是严峻的。从证据的新颖性程度来说,一个新颖的证据比起一个类似的或重复的证据来,能使科学理论获得更高的评价,经验证据愈是新颖,对科学理论的评价就愈高。
比如,广义相对论最初提出时,并没有取得多少支持证据,但它预言了星光经过太阳附近将发生偏转,偏离角度是1.75″(1″称为1角秒,等于2π/(360 × 60 × 60)弧度)。这是异常大胆新奇的预言,对于当时作为背景知识的牛顿力学来说是全然意外的、无法接受的。因为光线在人们的脑海里一直是与直线画等号的,所以根据广义相对论预言的光线弯曲效应是人们完全陌生的现象,并由此使之富有传奇的色彩。1919年,英国皇家天文学会和伦敦皇家学会派出两支分别由A·爱丁顿、C·戴维森和A·克罗梅林率领的观测队前往西非几内亚湾的普林西比岛和巴西北部的索布雷尔进行5月29日日全食的观测。两地观测结果于11月6日公布,前者为1.61″,后者为1.98″,平均为1.79″,验证了广义相对论的预言。当时全世界为之轰动,气氛之热烈,在科学史上是空前的。这次验证所以能使广义相对论顷刻间闻名于世,并使许多科学家转变态度,转而接受广义相对论,就是由于这样的确证证据给了理论异乎寻常的极强有力的支持。
3.可证伪性:证伪论与“逼真度”评价
英国著名科学哲学家K·R·波普尔批判了逻辑经验主义的观点,提出了证伪主义理论。他认为,“衡量一种理论的科学地位的标准是它的可证伪性或可反驳性”(33),只有具有可证伪性、可反驳性的理论,才是科学的;反之,不具有可证伪性、可反驳性的理论,就是非科学的。这是由于A·爱因斯坦的物理学革命影响了他。K·R·波普尔说:“没有爱因斯坦,我就永远得不出我的这些观点。”(34)1919年,A·爱因斯坦的广义相对论关于光线弯曲的预言得到了观测的支持,这给了K·R·波普尔的理智以巨大的震动。“这意味着,任何理论不管曾获得何等的成功,也不管曾经受过何等严格的检验,都是可能被推翻的。”(35)他认为,科学之为科学,不是因为它可以找到支持自己的例证,而是在于经验上能否被证伪。因为像占星术之类的非科学同样可以“拥有根据观察、根据算命天宫图和根据传记所积累的大量经验证据”(36),声称自己得到了“经验证实”而钻进科学的行列。所以,科学并不在于它的可证实性,而是在于它的可证伪性。(www.xing528.com)
证伪主义是以可证实性与可证伪性之间的不对称为根据的。“这个不对称来自全称陈述的逻辑形式。因为这些全称陈述决不能从单称陈述中推导出来,但是能够和单称陈述相矛盾。”(37)不管我们观察到多少只白天鹅也不能证明“所有天鹅是白的”的命题,但只要观察到一只黑天鹅就能证明此命题为伪。上述推理的后一部分,其实质就是否定后件的演绎推理。K·R·波普尔指出:“这里提到的证伪的推理方式——用这个方式,一个结论的被证伪必然得出这个结论从之演绎出来的那个系统的被证伪,也就是古典逻辑中的否定后件的推理。”(38)这是一种必然推理,与归纳推理根本不同。其形式为:
式中,“T”表示一个陈述系统(全称陈述),“P”表示T的一个结论(单称陈述),“T→P”表示可以从T导出的关系,“”表示P是假的,读作“非P”。这个公式的意思是:“如果P可从T推导出来,而且如果P是假的,那么T也是假的。”(39)
K·R·波普尔的证伪主义理论含有一定的合理因素,它揭示了科学理论具有相对性的一面,科学理论受历史条件的限制,不可能一劳永逸地尽善尽美,往往可能被证伪。然而,在经验科学的实际检验过程中,证伪一个被检验的理论与证实一个被检验的理论一样,也不存在逻辑的必然性。事实上,证伪一个科学假说并不像逻辑学上否定后件就必然否定前件那样简单。其一,科学假说从来就不是孤立地为实验所反驳的;实验的反驳总是对准构成理论的假说整体,它不可能指出整体中的哪一部分应该被抛弃;其二,科学理论具有韧性,不能仅凭几个经验事实就可以驳倒。著名科学哲学家I·拉卡托斯就说过:“K·R·波普尔的可证伪性标准解决了科学与伪科学的分界了吗?没有。因为K·R·波普尔的标准忽视了科学理论明显的坚韧性。”(40)具有坚韧性的科学理论并非一两个观察陈述所能证伪的。
对K·R·波普尔的批判回应表明,“证伪”不可能维持它原初形态不变。依照K·R·波普尔的著名范例,“所有的天鹅都是白的”这一普遍命题永远不会被证实,因为这要求了解过去、现在和未来的所有天鹅;但是它可能通过发现一只黑天鹅而被证伪。然而,事情并不这么简单。一只黑天鹅的发现也许不能证伪这一命题:一只被染黑的或掉在煤烟中的天鹅,并不能作为一个证伪的实例:发现一只天鹅与黑鹰相结合后产生的黑色动物,也不能作为证伪的实例。这些范例表明,“所有的天鹅都是白的”预示了鸟类的颜色分类和生物形态的起源理论。因此,证伪不可能是理论与经验的二元关系,必须考虑到理论的经历和与其他理论的比较评价。
由于可证伪作为科学和非科学的划界遇到了种种困难,使许多人难以接受,因此K·R·波普尔解释说,他的“可证伪性作为划界标准,不是作为意义的标准”(41)。同时,他还强调科学和真理并不是一回事,科学的标准和真理的标准并不是同一个标准。K·R·波普尔在他的早期著作中很少提到真理的问题,当A·塔尔斯基发表了“语言学的真理概念和语义学的基础”一文之后,他表述了对真理的看法,认为“真理就是符合事实的同义语”(42),“科学的任务在于追求真理”(43),并提出了理论逼近真理和理论的“逼真性”概念,用以在理论之间进行评价和比较。
在K·R·波普尔看来,科学家的目标是通过批判寻找愈来愈逼近真理的科学理论。他把科学理论所具有的逼近真理的性质称为“逼真性”(verisimilitude),而把理论逼真性的程度叫做“逼真度”(degree of verisimilitude)。一个理论愈进步,它就愈合乎事实,就愈接近真理,它的逼真度就愈高。为了定义“逼真度”,K·R·波普尔把科学理论视为是真实性内容(truth content)与虚假性内容(falsity content)的统一。一个理论,只要被经验验证过,就说明它的内容具有一定的真实性;但由于理论仅是猜测,它的内容又必然具有一定的虚假性。假定理论α的内容以及真性内容和假性内容都是原则上可度量的,那么就可用以下的公式来定义理论α的逼真度(44):
V s(α)=CtT (α)-CtF(α)。
这里,V s(α)表示理论α的逼真度,CtT (α)表示理论α的真实性内容,CtF (α)表示理论α的虚假性内容。因此,可以根据科学理论的逼真度而对其进行评价。这就是说,一个理论的逼真度等于它的真实性内容的量减去虚假性内容的量,即一个理论的真实性内容愈大,而虚假性内容愈小,它的逼真度愈高,这一理论就愈进步。
K·R·波普尔认为,一个新理论在下述六种情况下,可以认为其逼真度比旧理论高(45):
①作出了比旧理论更精确的论断,这些更精确的论断可以经受更精确的检验。
②比旧理论考虑到并解释了更多的事实。
③比旧理论更细致地描述或解释了事实。
④通过了旧理论所不能通过的检验。
⑤提出了旧理论没有提出过的或者对旧理论不适用的新的实验检验,并且通过了这种检验。
⑥能把旧理论无法统一的问题统一起来或联系起来。
K·R·波普尔通过逼真性的概念把理论的深刻内容和理论的真理性结合起来的思想,无疑是有重要意义的。它正确地揭示了科学理论从似然性向实然性逼近的过程,即随着科学实践的发展,科学理论所包含的真理内容不断增加,谬误内容不断减少,理论的逼真性也就得到了真正的发展。但是,要一般地把逼真性概念应用于科学理论的评价,则存在着根本的困难,这不仅因为理论的真实性内容和虚假性内容难以量化,而且两者之间在质上也是难以比较的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。