在进行显著性检验时,甚至在进行由费舍尔提出并被继任者们不断完善的复杂运算之前,我们会遇到一个非常棘手的哲学难题。在第二个步骤的开头,即当我们“假定零假设为真”时,这个难题便会悄然而至。
在大多数情况下,例如在检验避孕药的副作用、莎士比亚的头韵修辞法、《托拉》能预测未来等问题时,我们需要证明的是零假设不成立。做出一个与我们的预期目标相反的假设,从逻辑上讲,似乎有循环论证的嫌疑。
关于这个问题,我们其实无须担心,它是始于亚里士多德并经过时间检验的论证方法,叫作反证法或归谬法。反证法是数学领域的柔道,为了证明某个命题不正确,先假设该命题为真,然后借力打力,通过一个“过肩摔”来完成证明。如果结果是错误的[1],那么该假设必然是假命题,其思路为:
·假定假设H为真;
·根据H,某个事实F不成立;
·但F是成立的;
·因此,H不成立。
假如有人冲着我们惊呼:2012年,哥伦比亚特区有200名儿童遭遇枪击身亡。这就是一个假设,但是可能难以核实。如果假定该假设是正确的,那么在2012年,哥伦比亚特区的杀人犯总数就不可能少于200人。但是,那一年的杀人犯总数是88人,少于200人。因此,这个假设肯定是错误的,而且这个论证过程中没有任何循环论证的成分。试探性地“假定”一个假设为真,也就是建立一个与事实相反的虚拟世界,使H成立,然后观察H在现实的作用下轰然坍塌。
从这种表述来看,反证法几乎毫无价值,从某种意义上讲也的确如此。但是,更准确地说,反证法是一种推理工具,我们对这种工具的使用已经得心应手,以至于我们都忘记了它的强大作用。实际上,毕达哥拉斯在证明2的平方根是无理数时,借助的就是这种非常简单的反证法。这个证明方法完全颠覆了传统,令人震惊的同时也让人们对它的始作俑者爱恨交加。它的证明过程十分简单、精炼,即使全部写出来也用不了多少篇幅。
假定H:2的平方根是有理数。
即可表示成分数m/n的形式,其中m、n是整数。我们还可以写出最简分数的形式,也就是说,如果分子与分母有公因数,就同时除以该公因数,分数保持不变。既然5/7的形式更为简单,我们就没有理由把这个分数写成10/14的形式。因此,该假设可以下述方式重新表述:
假定H:2的平方根等于m/n,其中m与n为没有公因数的整数。
也就是说,m与n不可能同时为偶数。如果两者同时为偶数,就说明它们有公因数2,此时,跟化简10/14这个分数一样,我们可以把分子与分母同时除以2,该分数保持不变。简言之,分子与分母同为偶数的分数不是最简分数。因此,F(m与n同为偶数)是不成立的。
既然,等式两边同时平方,我们可以得到2=m2/n2,即2n2=m2。因此,m2是一个偶数,从而说明m是偶数。一个数字是偶数的条件是该数字可以写成整数与2的乘积的形式,因此,我们可以把m写成2k的形式,k为整数(事实上,我们就是用这种形式来表示偶数的),即2n2=(2k)2=4k2。等式两边同除以2,得到n2=2k2。
上述代数运算有什么意义呢?其实就是证明n2是k2的2倍,因此n2是一个偶数。如果n2是偶数,n就与m一样,也是一个偶数,这说明F是一个真命题!通过假定H为真,我们得到一个错误的甚至是荒谬的结果:F既是真命题,又是假命题。因此,H必然是错误的,也就是说,2的平方根不是有理数。通过假定2的平方根是有理数,我们成功地证明它并不是有理数。这个方法的确很奇怪,但却行之有效。
我们可以把零假设显著性检验视为一种模糊的反证法:
·假定零假设H为真;
·根据H,得到某个结果O的可能性非常小(比如,低于费舍尔设定的0.05这个临界值);(www.xing528.com)
·但O是可以观察到的事实;
·因此,H成立的可能性非常小。
换句话说,这不是归谬法,而是“归为不可能法”(reductio ad unlikely)。
这方面的一个经典例子来自于18世纪的天文学家、牧师约翰·米歇尔(John Michell),他是最先将统计学方法应用于天体研究的学者之一。几乎所有的文明都观察到,在金牛座的一个角落有一个昏暗的星团。纳瓦霍人把这个星团称作“Dilyehe”,意指“闪亮的图形”;毛利人把它称作“Matariki”,即“神的眼睛”;在古罗马人的眼中,它是一串葡萄;日本人认为它是“Subaru”(现在,大家知道“斯巴鲁”的标志为什么是6颗星了吧);美国人则把它叫作“Pleiades”(昴星团)。
几个世纪以来,人们一直在观察昴星团,关于它的神话传说不断,但是都无法回答最基本的科学问题:昴星团真的是一个星团吗?这些星球彼此间是否存在无法测算的距离,而从地球看过去,它们却正好排列在同一个方向上?在我们的视觉框架中随机分布的光点会呈现出下图所示的情形:
是否可以看到有些光点集中在一起?这样的情况并没有出乎我们的意料,因为总会有一些星球正好位于另外一些星球的上方。如何断定昴星团中的星球排列没有出现上述情况呢?GVT指出:状态非常稳定的组织后卫的投篮命中率不会有明显的变化,但有时也会连中5球。同样,星球的排列也可能出现类似的巧合。
如果昴星团的星球排列如下图所示:
这些星球没有明显地簇拥成团,这种情况反而说明它们并不是随机分布的。在裸眼看来,这幅图似乎“随机程度更高”,但事实并非如此,它说明这些光点有拒绝排列在一起的倾向性。
因此,尽管上述星球看上去明显构成一个星团,但是我们不应该认为它们在太空中的距离真的很近。反之,如果天空中一组星球间的距离非常接近,我们就应该认为这不一定是偶然现象。米歇尔指出,如果星球在太空中随机分布,那么有6颗星球均匀排列、肉眼看上去与昴星团相似的概率非常小。根据他的计算,这个概率大约为1/500000。但是,昴星团的那些星球就在天空中紧密地簇拥在一起,像一串葡萄一样。米歇尔断言,只有傻瓜才会相信这是一种偶然现象。
费舍尔对米歇尔的研究成果表示认同,并明确指出米歇尔的论证方法与经典反证法两者之间的相似之处:
从逻辑上讲,该结论的可靠程度等同于一个简单析取(disjunction):要
么极不可能的事情真的发生了,要么随机分布理论是不正确的。
米歇尔给出的证明令人信服,他得出的结论也是正确的:昴星团不是一种巧合现象,而真的是一个星团,但该星团是由数百颗年轻的恒星构成的,而不是仅仅包含肉眼可见的那6颗星。我们还可以观察到很多与昴星团类似的星团,在这些星团中,恒星紧密地簇拥在一起,密集程度之高远远超过运气使然的范围。这样的事实充分说明,这些恒星并不是随机分布的,而是太空中某种真实的物理作用把这些恒星聚拢到了一起。
但问题在于,归为不可能法与亚里士多德提出的反证法有一个不同点:从总体上看,归为不可能法不合乎逻辑。在应用该方法时,我们有时会得到荒谬的结论。长期担任梅奥医学中心统计部门领导的约瑟夫·柏克森(Joseph Berkson)认为某个方法不可靠时,就会大声质疑它(并四处宣扬他的疑虑)。他曾经举了一个非常著名的例子,用它来证明归为不可能法有缺陷。假定有50个实验对象,他们都是人(H),你发现其中一个是白化病人(O)。由于白化病人极为稀少,两万人中患有此病的人通常不超过1个。因此,如果H是正确的,那么在这50名实验对象中发现一名白化病人的概率非常小,不足1/400[2],即0.0025。所以,在H的条件下观察到O的概率(p值)远小于0.05。
因此,根据统计学理论,我们非常确定H是不正确的,也就是说实验对象不全是人。
人们经常会把“可能性极小”理解成“基本不可能”,而且,“基本”一词的影响力会越来越小,并最终淡出人们的考虑范围。但是,“不可能”与“可能性极小”是不同的概念,两者的意思相去甚远。不可能的事情绝不会发生,而可能性极小的事件并不少见。这就意味着我们在根据可能性极小的观察结果进行推理时,由于受到归为不可能法的影响,会采取一种不可靠的逻辑立场。因此,北卡罗来纳的彩票游戏在一周之内出现同一组号码(4、21、23、34、39)两次中奖的情况时,引起一片质疑之声,很多人怀疑其中有猫腻。其实,每组号码出现的概率都是一样的。星期二的中奖号码为4、21、23、34、39,星期四为16、17、18、22、39,这与同一组号码两次中奖一样,是可能性极小的事件,概率都为三千亿分之一。事实上,对于星期二与星期四这两天的中奖号码而言,出现任意一种结果的概率都是三千亿分之一。如果我们坚持认为可能性极小的结果足以说明彩票的公平性值得怀疑,那么,我们一辈子都会不停地给彩票委员会发邮件,因为无论中奖号码是什么,我们都会质疑它们。千万别干这样的傻事。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。