还记得前面提到的病毒测试吗?医生做了某种类型的病毒的筛选检测,结果呈阳性,表示你身上携带这种病毒。如果医生告诉你以下几种情况,你应该对这种病毒有怎样的估计呢?
当一个人有病毒时,这种检测会100%准确地表示他有病毒。
有5%的可能性,当一个人没有这种病毒时也会测出他有病毒。
这种病毒的出现几率是500人中会有1人携带该病毒。
那么,你真的有这种病毒的几率是多少呢?许多人说是95%左右。回想一下,前面我们已指出过,正确答案为大约4%。为什么是这样呢?让我们做一个小小的逻辑和数字推理。若500人中有1人真的有这种病毒,那么其他499人则没有。然而有5%的情况是当一个人没有这种病毒时却测出他有病毒,也就是说检测会将大约25个没有病毒的人指示为感染了病毒(0.05乘以499)。这个5%称为假阳性率,因为该检测肯定地将一个其实没有病毒的人标为有病毒。因此,当只有1人真的有病毒时,检测表明500人中有26个人有病毒(25个错的,一个对的)。也就是二十六分之一,大约是百分之四。因此,即使该检测指出你有病毒,你真的有病毒的几率只有百分之四。①
①类似实例的讨论可见于 J. Paulos的 Innumeracy:Mathematical Illiteracy and Its Consequences(New York:Vintage Books,1988),第89页;Sutherland,Irrationality,第208页;以及K. Stanovich,How to Think Straight about Psychology(Boston:Allyn and Bacon,2001)第161页。
如果你认为答案接近95%,不要觉得自己愚蠢。当将一个类似的问题抛给四家哈佛医学院教学医院的60位医生、学医的学生和住院医师时,出现频率最高的回答是95%。大约半数的医生说95%,而只有11个人给出了正确的答案。②甚至医学专家在他们的专业领域都会判断错误。事实证明,聪明的人往往没有受过训练,没学会用正确的方式思考这类问题。
②W. Casscells,A. Schoenberger和T. Graboys的“Interpretation by Physicians of Clinical Laboratory Results”,New England Journal of Medicine 299(1978):999。
大多数预测性检测通常都会出些错。虽然当一个人确实有病毒时,检测100%会指出这个人有病毒(真阳性率),但也有5%的情况是当一个人没有病毒时也测出他有病毒(假阳性率)。如果检测能完美地预测自然是好事,但是总体准确度几乎从来没有达到100%。因此,我们先必须考虑基准率(背景统计数据),基准率表示这件事发生的频率。我们通常不考虑这一背景统计数据,但它却是关键的信息。在我们的例子中,500个人中有一个人有这种病毒,它的基准率只有0.2%。接下来,应该根据检测的结果和“诊断性”来调整基准率。要评价检测的诊断性,必须比较真阳性和假阳性率。在这个病毒例子中,真阳性率是100%,而假阳性率是5%。因此我们应将基准率调整20倍(100%÷5%)。该数值表示我们从检测中得到多少信息——这个数值越高,检测结果应该对我们的判断越有影响。③(www.xing528.com)
③在实际计算中,用这个诊断比乘以有病毒相比没病毒的基准率,即(1.00 / 0.05)×(0.002 / 0.998)= 0.04008。 这表示有病毒的几率是0.04008∶1。为了将这一几率转换成概率,将这个数除以1加上该数的和,(0.04008 / 1.04008 = 3.85%,也就是本章所出现的1 / 26)。要了解这一计算的详细方法,参见任 一本统计学的书籍中的贝叶斯定理。许多人在评估测试的有效性时忽略了假阳性率。例如,公司内进行欺诈性检测的专家仅仅根据阳性命中率设计欺诈性的检测问卷。参见M. Romney,W. Albrecht和D. Cherrington的“Auditors and the Detection of Fraud,”Journal of Accountancy 149(May 1980):63。
根据检测信息做决定时,检测的诊断性是极其重要的。例如,许多人依靠测谎仪检测。警察和律师用它们进行刑事调查,FBI(联邦调查局)用它们来筛选雇员。④然而据估计,测谎仪的诊断值竟低至2比1。⑤正如在上面的医疗例子中看到的,当基准率非常低时,20比1的诊断性仅产生了4%有病毒的几率。测谎仪测试的可靠性要差得多,表示我们从测谎仪得到的有用信息很少。然而,律师、警察和联邦机构却十分重视它们的结果(谢天谢地,法庭上不用这个)。事实上,由于确定是罪犯的基准率通常很低,所以有人认为,唯一应使用测谎仪检测的时候是当你有罪时。为什么呢?当基准率低、而且有明显的假阳性率时,检测将无辜的人认定为有罪比将有罪者定为有罪的情况还要多。实际上,如果你有罪,你还有机会可以蒙混过检测;而如果你是无辜的,却有很大的几率被发现有罪。
④例如,在2001年间谍嫌疑人罗伯特•汉森被捕之后,有500位能得到情报信息的联邦调查局(FBI)员工接受了测谎测试。自1994年以来,所有应聘FBI工作的外来人员都被要求进行测谎。参见D. Eggen和D. Vise的“500 FBI Employees Will Be Given Lie Detector Tests”,Springfield(MA)Sunday Repu- blican,March 25,2001,第A5页。
⑤R. Libby,Accounting and Human Information Processing:Theory and Applications(Englewood Cliffs,NJ:Prentice-Hall,1981)第56页。虽然很难评估测谎仪测试的最终真假阳性率(比如一般真相的筛选与关于某一具体犯罪真相的筛选可能产生不同的结果),研究表明,总体误差率可以高达50%(见http://antipolygraph.org/read.shtml)。
公司领导人也不例外,常常会忽视基准率。例如,审计人员在确定要报告的审计意见类型时,使用破产预测模型。一项研究告诉审计人员,某个破产模型有90%的真阳性率和5%的假阳性率,而所有公司中大约有2%会破产。根据该信息,如果这个模型预测某家公司会破产,那么这家公司破产的概率是27%。然而,审计人员估计的平均概率是66%,而最常见的回答是80%。虽然这些专家似乎比新手做得好一点,但他们在做关于概率的决定时也没有充分重视基准率的意义。⑥
⑥T. Kida,“The Effect of Causality and Specificity on Data Use”,Journal of Accounting Research 22(1984):145。还记得我们对于溯求原因的偏好吗?有趣的是,如果基准率符合因果模式,审计人员会更多地注意它。例如,该研究还发现,当基准率涉及有类似现金流的几个公司(一个因果变量)时,审计人员的平均判断率(39%)更接近于正确的概率。
既然基准率如此重要,那么我们为什么会忽略它们呢?代表性是一个原因。这项检测告诉我们,我们与有病毒的人具有相似的特征,或者某家公司与其他破产的公司相似,因此我们将注意力放在了这类信息上。但是忽视基准率可能还有其他原因。因为我们是故事讲述者,而不是统计学家,所以认为背景统计信息不是很重要。但是它们确实很重要!那么我们应怎样做呢?对于关键的决定,我们可能要用公式计算概率。然而,即使不通过公式计算,也要知道应注意背景统计信息,这样的话,应当有助于我们做出更明智的判断。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。