相关性有可能是某些尚未被人们发现的共同原因造成的,因此令人困惑,但是更加难以捉摸的是,相关性还有可能是某些共同结果造成的。这个现象叫作“柏克森悖论”(Berkson's Fallacy),是以我们在第8章介绍的约瑟夫·柏克森这位医学统计学家的名字命名的。柏克森告诫人们不可盲目依赖p值,否则便可能得出“其中有一名白化病人的一小群人都不是人”的荒谬结论。
与费舍尔一样,柏克森本人也强烈怀疑吸烟与肺癌之间存在联系的观点。柏克森这位医学博士代表的是老一辈的流行病学家,他们坚定地认为过于依赖统计数据而忽略医学研究的任何说法都是不可靠的。在他看来,这些说法是稚嫩的理论学家擅自闯入医学领域后草率得出的结论。1958年,他在著作中指出:“癌症是生物学问题,而不是统计学问题。在阐释癌症问题时,统计学可以发挥非常好的辅助作用,但是,如果生物学家听任统计学家在生物学问题上指手画脚,就必然会给科学带来灾难。”
人们发现吸烟不仅与肺癌之间存在相关性,而且会影响人体的所有系统,与多种疾病之间都存在相关性。这个事实让柏克森尤其无法接受,因为他认为烟草的危害绝对不可能如此全面、彻底,“如果人们已经确认某种药物可以缓解普通感冒,而调查发现这种药物不仅可以治疗伤风,还可以治愈肺炎、癌症等多种疾病,科学家就会认为‘研究方法肯定出了问题’。与之相似,烟草也不可能危害人体的所有系统”。
柏克森与费舍尔都更倾向于“体质假设”,即吸烟者与非吸烟者之间预先存在的某种差异,是非吸烟者相对健康的原因。
如果85%~95%的人口都是吸烟者,那些不吸烟的少数人就代表了某种特殊的体质类型。我们不能确定这些人的平均寿命会更长,但是这部分人的总体死亡率将相对低一些。烟草商无时无刻不在劝诱我们吸烟,想方设法地刺激我们的神经,但是,这一小部分人成功地抵制住了诱惑,说明他们的意志力更强。既然他们可以抵制烟草商的诱惑,那么他们抵御肺结核甚至肺癌的能力也应该更强!
柏克森也不认同多尔与希尔在英国医院收治的病人中开展的独创性研究。1938年,柏克森通过观察发现,以这样的方式选择病人,研究结果有可能会显示出根本不存在的相关性。
假设我们想研究高血压是否会导致糖尿病。我们可能会在住院病人中开展调查,研究高血压在糖尿病人中还是在非糖尿病人中更加普遍。结果,我们发现糖尿病人中患高血压的人比较少。我们对这个结果感到吃惊,并有可能认为高血压有预防糖尿病的作用,至少可以防止糖尿病严重到必须住院治疗的程度。但是,在建议糖尿病人大幅增加食盐摄入量之前,最好看一看下面的数据。
总人口:1000人
高血压患者数量:300人
糖尿病患者数量:400人
同时患高血压和糖尿病的人数:120人
假设我们这座城市的总人口为1000人,其中40%的人患有高血压,40%的人患有糖尿病。(这是因为我们这里的人偏爱咸和甜。)我们再假设这两种病之间不存在任何相关性,400名糖尿病人中有30%的人(120人)同时患有高血压。
如果这些患者都住进了医院,那么医院里有:
180个只患有高血压的患者;
280个只患有糖尿病的患者;
120个既患有高血压又患有糖尿病的患者。
在住院治疗的400名糖尿病人中,有120人(30%)还患有高血压。在住院治疗的180名非糖尿病人中,患高血压的人占100%!如果有人据此得出高血压可以预防糖尿病的结论,那只能说明这个人太傻了。这两种病之间存在负相关关系,但并不是因为两者相互排斥,也不是因为某个隐藏的因素既会让人患高血压,还会调节人体内的胰岛素,而是因为它们会导致一个相同的结果——让人们住院。(www.xing528.com)
换句话说,人们住院是有原因的。如果你没有患糖尿病,那么住院的原因更有可能是患有高血压。因此,高血压与糖尿病之间看似存在因果关系,但其实只是一种统计错觉。
在现实生活中,与患有一种疾病的人相比,被两种疾病缠身的人更有可能住院。整座城市中120名患高血压的糖尿病人也许都会住院治疗,而90%只患有其中一种疾病的人则待在家中,没有住院。而且,人们还可能会出于其他原因住院。例如,在这一年下第一场雪的那天,很多人用手清理铲雪机,结果手指头被铲雪机绞断了。因此,住院病人可能包括:
10名没有患糖尿病也没有患高血压但是手指被绞断的患者;
18名没有患糖尿病的高血压患者;
28名血压正常的糖尿病人;
120名既患有高血压又患有糖尿病的患者。
如果我们研究这些住院病人,就会发现148名糖尿病人中有120人(81%)患有高血压。但是,28名非糖尿病人中只有18人(64%)患有高血压。这似乎说明高血压会增加患糖尿病的可能性,但这仍然是一个统计错觉,它只能说明这些研究对象根本不是随机选取的。
在医疗以外的领域,甚至在特点无法精确量化的领域,柏克森悖论同样有意义。女性读者可能注意到一个问题,在与你们约会的男性对象中,相貌英俊的往往不友善,而友善的又往往其貌不扬。难道是因为男性五官端正而让女性觉得讨厌?还是因为友善导致男性相貌丑陋呢?这都有可能,但也有可能并非如此。下面我们看一个“男性特征大正方形”:
假设男性们分布于整个正方形中,共分成4种类型:友善且相貌英俊的男性、友善但相貌丑陋的男性、态度恶劣但相貌英俊的男性、态度恶劣且相貌丑陋的男性,而且各种类型的男性人数大致相等。
友善与相貌英俊有一个相同的作用,即都会让女性注意到具有该特点的男性。坦率地讲,女性根本不会考虑与那些态度恶劣且相貌丑陋的男性约会。因此,在这个大正方形中含有一个“可接受的男性特征小三角形”:
现在,我们可以找到上述现象出现的原因了。三角形中的那些英俊的男性具有从友善到态度恶劣的不同特征,他们受女性喜欢的程度与所有男性相当。因此,我们必须面对这个现实:最英俊的男性并不都是友善的。同样,友善男性的总体英俊程度也是平均水平。女性喜欢的那些相貌丑陋的男性则位于三角形的一个小角落里,他们非常友善,否则女性的心目中根本不会有他们的位置。与女性约会的那些男性,其相貌与性格之间必然存在负相关关系。但是,如果女性刻意地让男性采取恶劣的态度以实现美化其相貌的目的,女性就会成为柏克森悖论的牺牲品。
自命清高的文学作品也是如此。我们都知道流行小说的质量十分糟糕,并不是因为大众没有鉴赏力,而是由于受到“小说特点大正方形”的影响,我们只能看到“可接受的小说特点小三角形”中的那些要么流行要么优秀的小说。如果在阅读时刻意选择那些名声一般的小说(我曾经担任文学奖评委,我真的做过这样的事),我们就会发现所读的小说大多与流行小说一样,写得十分蹩脚。
当然,“大正方形”示意图过于简单。在评估约会对象或者每周读物的优劣时,我们不会仅仅考虑两个维度。因此,把“大正方形”变成某种“超级立方体”,效果会更好。而且,这取决于我们的个人偏好!在试图了解整个人群某个方面的情况时,你要知道对吸引力这个概念的理解,不同的人有不同的看法。他们为不同的评判标准赋予的重要程度各不相同,甚至他们的喜好也彼此格格不入。因此,在汇总很多人的观点、喜好与欲望时,我们还会遇到一系列的难题,可能需要运用更多的数学知识。接下来,我们将讨论如何解决这些难题。
【注释】
[1]本例中所有数字纯属杜撰。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。