Naked Statistics
1%的小概率风险如何在2008年成为击垮美国华尔街的“黑天鹅”,并毁了全球金融体系。
归根结底,数据还是数据,肯定没有数据使用者聪明,但有些时候,数据也会让聪明绝顶的人干蠢事。我能想到的近几年来最不负责任的数据使用案例就是2008年金融危机爆发之前华尔街的风险评估机制了。那时候,整个美国金融行业使用的都是同一个风险晴雨表—风险价值(VaR)模型。理论上说,VaR既是一个简洁的指标(将大量信息整合为一个单独的数字),又有强大的概率学支撑(对每家公司的资产和交易头寸都给出了预期收益和损失值),是一个不可多得的投资工具。该模型认为,公司的每一项投资都存在着大量可能的结果,比如投资通用电气的股票,这些股票既有可能升值,也有可能贬值。如果在一个相对较短的周期内(比如一周)采用VaR模型进行投资评估,最有可能得到的结果是购入的股票在短期内基本维持原状,上涨或下跌10%的概率很小,上涨或下跌25%的概率就更小了,也就是说,变化越大,概率越小。
在分析了以往市场变动的数据之后,公司的数量分析专家(这是行业内的称呼,但在其他地方,人们更愿意称他们为“有钱的呆子”)会给出一个数字(比如说1 300万美元),用来表示一项投资在一个特定周期内有可能让公司蒙受的最大损失,出现这种结果的概率为1%。也就是说,这项投资在99%的情况下会使公司的损失低于1 300万美元,但还有1%的概率造成重大损失。
请记住上一段内容里的最后一句话,这句话至关重要。
在2008年金融危机爆发之前,各大公司对VaR模型信任有加,在量化整体风险时都会采用这一统计模型。假设一个交易商手上有923项不同的“敞口头寸”(即可能会出现涨跌的投资),每一项投资都能像通用电气股票的例子那样进行VaR分析,然后再计算得出该交易商手中的证券组合的总体投资风险,该公式甚至还考虑到不同投资之间的相关性。例如,如果两项投资的预期回报呈负相关关系,即一项投资的损失会被另一项投资的收益所抵消,那么这两项投资的整体风险要小于其中任意一项投资。一般而言,投资部门的主管会知道其手下的交易员鲍勃·史密斯的24小时VaR为1 900万美元,即在接下来的24个小时内,鲍勃最多会让公司亏损1 900万美元,而且这一情况发生的概率仅为1%。
更妙的是,该投资部门在任何时候都可以得出全公司的风险指数,只需要在上述基础上稍微向前推进一步即可。当然,这其中所包含的数学运算是非常复杂的,因为要考虑到公司所参与的种类繁多的金融产品,而且还涉及多国货币,每项投资的杠杆率(进行投资的贷款额)也不一样,不同国家的资金流动率也存在差别等。但这些都不能阻碍投资经理们在任何时候得出一个看上去十分精确的风险指数,正如《纽约时报》前财经作家乔·诺切拉所解释的那样,“VaR最吸引人的地方,也是其最大的卖点就在于将风险描述为一个单一的数字—一个美元数据,仅此而已,而那些恰好不擅长数量分析的人就会趋之若鹜。”摩根大通公司是VaR模型的创始者,经过不断的开发和完善,每日的VaR如今已经有了一个新的名称—4:15报告,因为在每天下午的4点15分,即当天的美国金融市场休市没多久,每一位公司高管的桌子上就都会出现VaR报告。
按理说这是一件好事,通常情况下总是信息越多越好,尤其当与风险联系在一起的时候。毕竟概率是一个非常强大的工具,施利茨啤酒公司的高管们在砸重金举办“超级碗”中场盲品活动直播之前,不是也借助了概率学吗?后来的效果,大家不也看到了吗?但那时的概率计算和现在的一样吗?
这可真不好说。有人说VaR模型是“潜在的灾难”,也有人认为赋予其“欺诈犯”,以及其他一些不适合写入“统计学家谱”的邪恶称呼,这一模型甚至还被看作2008年金融危机的始作俑者和罪魁祸首,那次金融危机之所以会爆发且程度严重,就是因为VaR。对于VaR模型最主要的诟病在于,金融市场的潜在风险并不像抛硬币或啤酒盲品会那么容易预测,该模型呈现出的“伪精准”会给投资者带来虚幻的安全感。VaR模型就像是一个不准的车速表,错误的速度数据对司机来说比没有车速表更危险。如果你对一个失准的车速表过于信任,你就会忽略其他提示车速不安全的信息;但如果车里压根儿就没有车速表,你反而会小心地注意四周,寻找能够告诉你车辆当前行驶速度的参照物。
大约在2005年,每个工作日的4点15分被放在投资经理办公桌上的VaR报告,见证着华尔街正在变成一条通往财富的“金光大道”。可是不幸的是,VaR模型的风险档案里隐藏着两个巨大的问题。第一,模型构建的概率基础参照的是过去的市场行为,然而金融市场和啤酒盲品会不一样,前者的未来不一定是历史的重复,没有任何的理论证据可以保证1980~2005年间的市场动态是2005年之后市场表现的最佳预测参照物。从某些方面来看,这一缺乏想象力的行为总是认为即将开始的战争与上一场战争的情况差不多。从20世纪90年代开始一直到21世纪初,商业银行的房屋按揭业务所使用的贷款模型都认为房价出现大幅度下跌的概率为零。在以前,美国房价从来没有像2007年跌得那么惨、那么快,但这就是活生生的事实。美联储前主席格林斯潘在接受美国国会委员会质询时解释:“在2007年夏天,金融领域的理论大厦完全坍塌,这是因为之前的风险管理模型所收集的数据只涵盖了过去20年—经济快速增长的狂欢的20年。我认为,如果我们的模型能够充分地考虑历史上出现的几次危机,让模型更加完善的话,银行在放贷时的资本要求会更高,金融世界就会在更加健康和稳定的状态下运行。”
第二,即使通过基本数据,我们能够借助VaR准确地预测未来风险,这99%的保证依然存在着失效的危险,因为真正把事情搞砸的正是剩下的1%。对冲基金经理戴维·埃因霍恩解释说:“这就像你的汽车配备的安全气囊,平时看不出来有什么问题,但就在你发生车祸的时候它没有及时弹出来保护你。”假设一家公司的VaR为5亿美元,也就是说这家公司在未来给定的一段时间内损失不超过5亿美元的概率为99%,我们同样也可以这样理解,即这家公司有1%的概率遭受超过5亿美元的损失—而且在某些情况下的损失要大大超过5亿美元。事实上,这一模型根本没有办法告诉你假如那1%的情况发生,事态会有多严重。很少有人会关注“尾部风险”(位于分布曲线末尾的小概率事件),以及这些小概率风险所带来的灾难性后果。(如果你从酒吧出来打算回家,虽然你的血液中酒精含量只有0.15,撞车死亡的概率还不到1%,但酒后驾车依然是一个不明智的决定。)更甚的是,许多公司还天真地以为自己对那些小概率风险已经作了充足的准备,这无疑是雪上加霜。美国财政部前部长鲍尔森解释说,许多公司觉得只要出售资产,就能在很短的时间内筹集到现金。但危急关头,几乎所有公司都需要现金,这些公司全都在想办法出售相同类型的资产,从风险管理的角度看,这就像一个人说:“有灾难降临?那也没必要事先储备净水,到时候只需要去超市买几瓶矿泉水就行了。”可是当小行星真的撞上了你所在的小镇,生活在这里的其他5万名居民也想着要去超市买水,那么等你赶到超市的时候你会发现,超市的玻璃已经被砸了,货架上什么东西都没有。
当然,你会觉得担心行星撞地球这种小概率事件根本是杞人忧天,而这正是VaR模型灌输给投资人的想法。乔·诺切拉总结了《黑天鹅:如何应对不可预知的未来》[1]一书的作者,同时也是VaR模型的强烈反对者纳西姆·塔勒布的观点:“最大的风险从来就不是那些你能看得见、算得出的,而是那些你看不见从而无从估量 的,那些看上去似乎远不在正常概率范围内、远远超出你的想象、你认为一辈子都不可能发生的风险,事实上,它们的确会发生,而且比你所能想到的要频繁得多。”
从某些方面来看,VaR模型的崩溃是施利茨啤酒案例的反面教材。施利茨的广告推广是基于一个已知的概率分布模型,无论参与盲品会的观众最后选择施利茨啤酒的概率为多少,施利茨公司总能通过运作将其转化为有利于自身品牌宣传的结果。施利茨甚至专门选取了其他品牌的忠实用户参与盲品会,以此来规避不利结果,就算只有不超过1/4的米切罗啤酒爱好者选择了施利茨(这在概率上基本属于不可能的范畴),施利茨依然可以声称每4位米切罗啤酒支持者中就有一位会考虑更换品牌。但这个例子最重要的一点或许是,不管概率怎么计算和预测,终归只是啤酒的事,与全球金融体系扯不上关系。
华尔街的数量分析专家们犯了3个最基本的错误。第一,他们混淆了“精确”和“准确”的概念。VaR模型就像是我的高尔夫测距仪,我以为计量单位是“码”,可实际显示的计量单位却是“米”:确实精确,但并不准确。错误的精确让华尔街的高管们自以为是地认为他们对风险状况尽在掌握。第二,他们对基础概率的估算方式是错误的。正如之前格林斯潘在接受质询时所指出的,不应该只用2005年以前相对平稳和繁荣的经济数据来预测接下来几十年的市场表现。这就好像一个人去赌场玩轮盘赌,心里想着自己有62%的概率会赢,因为上次玩轮盘赌赢钱的概率就是62%,结果怎么样呢?这对他来说将会是一个难熬、难忘的夜晚。第三,公司忽略了“尾部风险”,VaR模型预测的是那些发生概率为99%的结果,这也是概率的工作原理(本书的后半部分将会不断地重复这一概念)。即使是貌似不可能的事件,也有发生的可能。事实上,放眼望去,它们并没有人们想象得那样罕见,每天都有人被雷击中,甚至我的妈妈打高尔夫球一杆进洞的情况都出现了3次。
供职于商业银行和华尔街的那些狂妄自负的统计专家,最终促成了自20世纪30年代大萧条以来最严重的全球金融紧缩,这场始于2008年的金融危机在美国导致了无法估量的美元币值蒸发,将失业率数字推高到了10%以上,引发了一波又一波的房屋止赎潮,还让世界各国政府都陷入了巨大的债务危机之中,它们在遏制经济损失的过程中苦苦挣扎。面对这样一个悲惨结局,类似于VaR模型这样旨在减少风险的精密金融工具给人们留下的除了讽刺,别无他物。
概率学提供了一系列强大且实用的工具,其中有许多工具都能为我们所用。如果使用得当,就能更好地辅助我们认识世界;如果使用不当,后果会不堪设想。鉴于全书内容我一直强调的是统计学是“一个强大的武器”,为此我想套用一下美国枪支权利支持者的话:概率学本身不会犯错,犯错的是使用它的人。本章接下来将会介绍一些最为常见的与概率有关的错误、误解和道德困境。
想当然地认为事件之间不存在联系。抛一次硬币得到正面的概率为1/2,抛两次硬币结果都为正面的概率为1/4,因为这两个事件是独立的,因此两次都得到正面的概率为各自概率的乘积。在领会了这一强大的概率学要点之后,你被正式提升为某大型航空公司的风险管理总监,你的助理告诉你越(大西)洋航班的引擎出现故障的概率为10万分之一,考虑到此类航班的班次较多,因此这样的风险还是应该极力避免。可喜的是,每一架越洋航班都配有至少两个引擎,你的助理计算得出在大西洋上空两个引擎都出现故障的概率为(1/100 000)2,即100亿分之一—一个理论上安全的风险。这个时候,你作为风险管理总监,就可以让你的助理收拾东西回家,以后再也不用来了。因为两个引擎发生故障并不是彼此独立的事件,如果飞机在起飞时迎面飞来一群天鹅,那么两个引擎都有可能出现损坏。同样的,许多其他的因素也会对飞机引擎的性能造成影响,如天气变化、维护不当等。如果一个引擎出现了故障,那么第二个引擎出现故障的概率肯定要大大高于10万分之一。
意识到这一点很难吗?对于20世纪90年代的英国检方来说,恐怕确实很困难,正是因为对概率的不当使用,他们做出了一次严重的司法误判。就像刚刚假设的飞机引擎的例子一样,英国检方所犯的统计学错误正是想当然地认为几个不同事件之间是彼此独立的(跟抛硬币一样),而忽略了它们之间的联系(某个特定结果的出现会增加类似结果发生的可能性)。但这次的事件却是真实的,无辜的人因此蒙受了牢狱之灾。
错误源自一种名为婴儿猝死综合征(SIDS)的疾病,具体表现为健康的婴儿无明显病症突然死亡。由于死于其他原因的婴儿数量日趋减少,相比之下死于SIDS的婴儿变得越来越常见,因此SIDS越来越受到关注。也因为这些婴儿的死因如此神秘、难以解释,各方的猜测和怀疑始终不绝。有些时候,这一怀疑是有道理的,因为尸检并不能有效地区分自然死亡和疏忽致死,一些不负责任的家长会用SIDS作为挡箭牌,以掩盖他们对孩子的照顾不周和虐待。英国检方和法庭认为,如果一个家庭中先后发生多起婴儿猝死事件,那么就可以认定婴儿是疏忽致死,而非自然死亡。英国著名的儿科医师罗伊·麦都爵士就经常为这一观点做专家证人。英国《经济学人》杂志写道,“一个婴儿的死亡是悲剧,两个婴儿死亡就很可疑,三个婴儿死亡便可断定为谋杀,这就是大名鼎鼎的‘麦都定律’。其依据是如果某个事件的发生概率本来不高,但在相同家庭里发生两次甚至多次则不可能是巧合。”麦都爵士在法庭上常常会向法官解释说,一个家庭先后有两个婴儿由于自然原因猝死的概率微乎其微,只有7 300万分之一。具体计算过程是:婴儿猝死本身就比较罕见,发生概率为1/8 500,那么相同家庭里两个婴儿猝死的概率就为(1/8 500)2,也就是约7 300万分之一。如果一个家庭有两个婴儿猝死,基本上可以断定孩子的父母是极不负责任的家长,判他们过失致死罪一点儿都不为过。在没有任何医学证据表明存在虐待或过失行为的前提下,法官一般都会采纳麦都爵士的专家意见,家长因此锒铛入狱。甚至有时候在出现过婴儿猝死的家庭,刚出生的婴儿会被强制送往其他地方抚养,以远离其亲生父母的“迫害”。
对统计事件独立性的错误理解,致使麦都爵士证词的严密性受到挑战,《经济学人》就此写道:
英国皇家统计学会指出,麦都爵士的逻辑存在一个明显的漏洞。概率计算本身没有问题,但前提是必须保证婴儿猝死事件是完全随机的,相互之间不存在任何未知的联系。但由于医学界对婴儿猝死综合征还未完全了解,同一家庭中先后猝死的婴儿之间非常有可能存在某种联系,例如基因等,从而让一个已经遭受婴儿夭折打击的家庭再次遭受打击。但由于那些家长已经被定罪,为了维护司法的严肃性,科学家们的建议是可能存在某种联系,仅此而已。
2004年,英国政府宣布对258起已经结案的家长谋杀婴儿的案件进行重审。
对两个事件的统计独立一无所知。人们犯的另一种常见错误是,面对相互独立的事件浑然不觉,甚至还将它们作为相关事件进行处理。假设你正在一家赌场里(虽然从统计学的角度看,你根本就不应该出现在这种地方),你会看到赌客们红着眼睛盯着骰子或扑克牌,嘴里念念有词“总该轮到我赢了吧”。如果轮盘球已经连续5次停在黑色区域了,有人就会想当然地认为下一次肯定会停在红色区域,大错特错!轮盘球停在红色区域的概率一直都没变,应该是16/38,这就是“赌徒谬论”。事实上,就算你连续抛1 000 000次硬币,并且结果全都是正面朝上,第1 000 001次抛硬币出现反面的概率依然为1/2。两个事件的统计独立性的定义正是其中一个事件的结果对另一个事件的结果不存在任何影响。就算你觉得从统计学的角度来解释不够有说服力,你也可以从物理的角度问问自己:一枚硬币连续抛几次的结果都是反面朝上,怎么做才能使它下一次抛出的结果是正面朝上?
即使在体育领域,这种线性思维也同样会给人带来错觉。有一篇广为人知、妙趣横生的与概率学相关的学术论文就驳斥了体育迷头脑中一个根深蒂固的观念,那就是篮球运动员存在“手感”这一现象,即手感来了,怎么投都能中,一投一个准,但手感一走,投篮命中率立即下降。绝大多数的体育迷们都相信,一个刚刚投篮得分的球员再次投中的概率要大于刚刚投篮失手的球员。但对于托马斯·季洛维奇、罗伯特·瓦隆和阿莫斯·特韦尔斯基这3位研究者来说,根本不存在所谓的“手感”一说,为此他们用了3种不同的方式来证明。首先,他们分析了费城76人队在1980~1981赛季主场的得分数据(当时,美国篮球职业联盟NBA的其他球队还没有类似的数据统计),发现“没有证据表明连续进球之间存在正相关关系”。随后,他们分析了波士顿凯尔特人队的罚球数据,也得出了相同的结论。最后,他们邀请了康奈尔大学男篮和女篮成员队参与控制试验,这些篮球队队员在上一个投球命中的情况下再进一球的概率为48%,上一个投球未中的情况下投球命中率为47%。对于年龄区间在14~26岁的运动员来说,一次投篮命中和再次投篮命中之间的关联是负相关的。在这一点上,全场只有一位运动员表现出了强烈的正相关关系。(www.xing528.com)
这和绝大部分篮球迷告诉你的情况大相径庭。举个例子,一篇论文的写作者在斯坦福大学和康奈尔大学进行的问卷调查显示,有91%的篮球迷认为,当球员连续两三次投篮成功后再次投中的概率要高于他连续投失两三次球后投篮命中的概率。这篇关于“手感”的论文告诉我们,人们脑海里的观念和事实往往存在差异,论文作者写道:“人们对于随机性的直观感受与概率的相关定律之间存在着鸿沟。”我们自认为看到了规律,可实际上或许根本不存在规律。
比如,成群癌症病例。
成群病例的发生。你或许从报纸或电视上看到过,某些地区的居民接连被查出患有某种罕见的癌症,而这在统计学上被认为是几乎不可能发生的事,于是所有人都把矛头指向了当地的水源、发电厂或移动信号发射塔。当然,我们不能排除这其中的某个因素就是罪魁祸首的可能性(后面的章节会为大家介绍,统计学是如何在众多干扰因素中辨识出存在关联的因素的)。但成群病例同样有可能只是单纯的巧合,不管发生的概率有多低。的确,在同一个学校、教区或工厂里同时有5个人患有某种罕见白血病的概率可能只有百万分之一,但不要忘记,学校、教区和工厂的数量也有好几百万。在其中的一个地方出现5位罕见白血病患者的概率并没有想象中的那么低,我们只是没有考虑到未出现白血病病例的学校、教区和工厂。换一个例子,中彩票大奖的概率可能只有两千万分之一,但当有人中奖的消息传开后,我们没有人会感到惊奇,因为毕竟彩票中心已经卖出了好几百万张彩票。虽然我个人对买彩票的行为比较反感,但伊利诺伊州彩票的广告词却深得我心:“总有人会中头彩,那个人有可能就是你。”
为了证明这一相同的论点,我还和我的学生进行过一个实验。班级的人数越多,效果越好。我让班上所有人都拿出一枚硬币,并从座位上站起来,我们一起抛硬币,硬币正面朝上的学生必须坐下。假设我们一开始有100位学生,在第一次抛硬币结束之后,有大约50人坐下;然后我们开始第二次抛硬币,之后还剩下约25位学生站着;然后是第三次、第四次……通常最后总是会剩下一位学生在连续5次或6次得到硬币反面朝上的结果后,依然站在那里,我会在这个时候走到这位同学的身边问他 “你是怎么做到的?”、“你平时都做些什么特殊训练,可以连续这么多次都做到反面朝上?”、“你是不是吃了什么特别的东西?”等,这些问题惹得全班同学哈哈大笑,因为他们目睹了整个过程,他们知道这位抛硬币得到6次都是反面结果的同学并没有什么特殊的技能,一切只是巧合。但如果脱离了这样一个环境,当我们目睹一些异常的事件发生时,我们总是会想:“没那么巧吧?背后肯定有什么原因。”但事情偏偏就是这么巧。
检方谬误。假设你是法庭陪审团的一名成员,听到如下事实:(1)犯罪现场找到的DNA样本与被告的DNA相吻合;(2)除了被告以外,该DNA样本与其他人相吻合的概率为百万分之一(在这个例子中,我们姑且认为检方提供的概率是准确的)。在这些证据的基础上,你会认为被告人有罪吗?
但愿你投的不是赞成票。
当统计证据的存在背景遭到忽视时,检方谬误就成了不可避免的事实。下面的两个场景分别解释了DNA证据是如何被用来指证被告的。
被告一:该被告是被害人生前的恋人,但被后者抛弃,在离犯罪现场3个街区以外的地方被捕,身上携带着杀人工具。在被捕之后,法医从他身上强行提取了DNA样本,后被证实与犯罪现场的一根头发相吻合。
被告二:该被告于几年前在另一个州以相同的罪名遭到起诉。一个囊括100多万名暴力罪犯DNA信息的国家级数据库里恰好收集了该被告的DNA样本,警方在犯罪现场找到了一根头发,提取了其DNA信息并在这个数据库中进行自动比对,比对结果最终指向了这名被告,而根据调查,他与被害者并无任何关系。
正如之前所说的,在这两个案例中,检方都可以义正词严地宣称,犯罪现场找到的DNA样本与被告相吻合,且该DNA样本与除被告以外的第二人相吻合的概率仅为百万分之一。但是在第二个案例中,被告完全有可能就是那个“第二人”,即100多万名DNA信息所有者中恰好与真正的杀人凶手的DNA相似的那个人。这是因为通过100万次的数据库样本对比,找到“第二人”的概率相对提升了。
回归平均数(或趋均数回归)。你或许曾经听到过一个叫作“《体育画报》封面诅咒”的说法,即成为《体育画报》封面人物的运动员或团队,在之后比赛中的成绩会出现不同程度的下滑。一种解释是,成为该杂志的封面人物会对接下来的表现产生不利影响。而另一个在统计学上更加说得过去的解释是,能上杂志封面的通常都是那些近期表现尤为出色的运动员或队伍,如20连胜之类的异乎寻常的竞技表现,而他们之后的比赛成绩只不过是回归正常水平,这一现象就叫作回归平均数。概率学告诉我们,跟在异常值—在某个方向上远离平均数的数据—之后的更有可能是那些接近(长期积累得出的)平均数的数据。
回归平均数现象可以用来解释为什么芝加哥小熊队总是花大笔的“冤枉钱”,请一些让球迷们失望的自由球员为其效力。通常,棒球运动员在完成了一个或两个成绩极佳的赛季之后,便获得了谈判加薪的资本,换上一身小熊队的球服并不一定会让这些球员的表现变差(虽然球员表现与球队的训练和管理十分有关),但是小熊队花了大价钱买来的却是这些超级明星超常发挥的“尾端”,每个球星超水平发挥的时间段都是有限的,也就是那么一两年,过了超水平发挥的时间之后,他们的表现便会趋于正常,这也是为什么他们在小熊队效力时会让球迷大失所望—并非因为他们的技术很差,只不过是正常水平而已。
同样的现象还可以用来解释为什么有些学生在考试中会超常发挥,有时候又会不尽如人意;有些学生明明考得没有平时好,但重考的成绩却又稍稍提升了。要解释这一回归现象,一种思路是学生的考试成绩(无论是文化课还是体育课)基本上是由个人的努力和运气(统计学家称之为“随机误差”)构成的。也就是说,那些在某次考试中超常发挥的学生只不过是交好运了,而那些考试成绩与平时相比大失水准的考生只是运气差了一些。当好运或厄运终于结束时(总有结束的那一天),随之而来的表现就会更加接近平均值。
假设我正在组建一支抛硬币的明星团队(在认为扔硬币与天赋和能力有关的错误观念的驱使下),我发现了一名连续6次抛硬币都反面朝上的学生,于是我向他伸出了“橄榄枝”—一份价值5 000万美元、为期10年的合约。不用说,10年之后我一定会失望至极,因为这名学生在这10年里抛出的硬币只有50%的情况是反面朝上。
乍一看,回归平均数可能会与“赌徒悖论”相排斥。当学生连续6次抛出的硬币都是反面朝上之后,下一次是不是“应该”正面朝上?他再次抛硬币得到正面向上的概率依旧没变:1/2。他已经连续多次抛出反面朝上的事实并不能增加他下一次抛出正面朝上的概率,每一次抛硬币都是一个独立事件。但是,我们可以期望接下来抛硬币的结果在总体上会和概率学所预测的一致,即半数是正面朝上、半数是反面朝上,而非之前出现的所有结果都是反面朝上。如果一个人一开始抛硬币的结果全都是反面朝上,那么在接下来的10次、20次或100次抛硬币的过程中肯定会出现更多的正面朝上的情况。大数定律告诉我们,抛的次数越多,得到的结果就越接近平均值(如果情况相反,那我们就应该开始怀疑是不是有人作弊)。
最后还有一个有趣的情况,研究者们发现了一个《商业周刊》现象。当公司高管获得了备受瞩目的高级别奖项,包括被提名为《商业周刊》的“最佳经理人”,他们的公司会在接下来的3年内遭受利润和股价的双重下挫。但是与《体育画报》效应不同的是,这一现象要比回归平均数复杂得多。根据加利福尼亚大学伯克利分校和洛杉矶分校的两位经济学家乌尔里克·马尔门迪尔和杰弗瑞·塔特的研究,当公司CEO们坐到了“超级明星”的位置,他们会被自身的“光环”所影响。他们开始写回忆录,被邀请成为外部董事,甚至开始物色美女为自己的终身幸福作打算(其实两位经济学家只给出了前面两个解释,第三个解释是我自己加的,而且我觉得这个解释同样具有说服力)。马尔门迪尔和塔特写道:“我们的研究表明,媒体主导的超级明星文化会导致行为扭曲,而且扭曲程度要超过单纯的平均值回归。”换言之,如果某位CEO成为《商业周刊》封面人物,请马上抛售其公司的股票。
统计性歧视。概率会告诉我们某个事件发生的可能性有多大,那么面对一个很有可能会发生的情况,我们到底应不应该做出反应?或者说,什么时候做出反应是可以的,而什么时候做出反应又是不可以的?2003年,欧盟就业社会事务专员安娜·迪曼托波罗提出,保险公司的保费政策不得因为客户的性别不同而有所差别,因为这违反了欧盟的平等对待原则。然而,对于保险公司来说,以性别区分保费的做法仅仅是出于统计学的考虑,与性别歧视无关。男性的车险费用要高一些,这是因为他们出事故的情况较多;女性需要多缴纳养老保险,这是因为她们活的时间更久些。当然,有的女性发生交通事故的比例高于男性,有的男性活得比女性久,但正如上一章所提到的,保险公司并不关心这些,它们只关心统计学意义上的现实,因为只要它们把平均值弄对了,公司就会挣钱。对于欧盟委员会于2012年实施的禁止保费男女有别的政策,有趣的地方在于,相关部门并没有否认性别与保险所承担的风险之间存在关联,但它们只是一直在强调这一基于性别的保费差异是不可能接受的。
这样的一个政策乍看上去会让我觉得反感,因为政策制定者们似乎眼里只有政治的正确性,对其他一概视而不见。但仔细一想,我又对自己的立场没那么确定了。还记得之前介绍的有关预防犯罪的知识吗?在这个领域,概率学既可以给我们带来神奇,也会增添很多烦恼。通过概率模型,我们得知从墨西哥进入美国的冰毒贩毒者最有可能是年龄为18~30岁、21点至凌晨驾驶红色皮卡车的西班牙裔男子,但同时我们也知道符合上述标准的绝大多数西班牙裔男子都不是毒贩,那我们应该怎么办?这就是我在上一章描述得天花乱坠的预测分析方法的缺陷所在,至少是缺陷的一个方面。
概率学告诉我们什么情况更有可能发生、什么情况更不可能发生,这仅仅是概率学的基础,也就是我们在之前几章里一直探讨的,但我们还不能忽视统计学的社会影响。如果我们想要捉拿暴力犯、恐怖分子、贩毒人员,以及其他有可能对社会造成巨大损害的个人,我们就必须动用手中的一切工具,概率只是其中的一种,如果在执法过程中死守着概率不放,而忽略了性别、年龄、种族、家庭、宗教以及国籍等综合因素,那将会犯下幼稚的错误。
对于这些信息(假设它们在某种程度上具有预测价值)的处理,我们能做什么、应该做什么将会是一个复杂的法律问题,而非单纯的统计问题。每天,我们都会收集到有关更多事物的信息,如果这些数据告诉我们正确的概率要比错误的概率高,我们是否就能堂而皇之地进行歧视了(这就是“统计性歧视”或“理性歧视”概念的由来)?那些会买鸟食的人逾期不还信用卡的概率较低(这是真的!),诸如此类的分析可以应用到生活的方方面面,但是分析应该做到哪种程度?如果我们建立一个能够识别毒贩的模型,正确率为80%,那剩下的20%的无辜的人该怎么办?因为这些人将会无止境地遭到这一模型的骚扰。
摆在我们面前的一个更大的问题是,数据分析对人们的行为和事件结果的影响已经大大超出了分析人员的想象。对欧盟委员会禁止男女有别的保险费的决定,你可以表示赞成,也可以表示反对,但我可以保证这绝对不会是最后一个让人左右为难的决策。我们总是习惯性地认为数字是“冰冷、确凿的事实”,如果计算无误,那么我们就一定能够得到正确的答案。但一个更为纠结和危险的现实是,有时候正确无误的计算也会将我们带往一个危险、浮躁的方向:我们可以摧毁金融体系,也可以骚扰一个恰好在某个时间出现在某个街头的22岁白人男子,因为根据我们的统计模型,几乎可以确定他打算去买毒品。尽管概率有再多的简洁特性和精准优点,也不能替代人类作为行为主体对其所进行的计算、进行计算的原因所作的思考。
【注释】
[1]《黑天鹅:如何应对不可预知的未来》于2008年5月由中信出版社出版。—编者注
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。