首页 理论教育 如何用贝叶斯法则进行性别判断?

如何用贝叶斯法则进行性别判断?

时间:2023-06-12 理论教育 版权反馈
【摘要】:[1]贝叶斯法则的核心理念是:即使只有少量数据,我们仍然能够通过提出假设并根据对事物的观察来修正这些假设,从而达到预测未来的目的。根据一两个数据,加上你自己的假设,用贝叶斯法则就可以准确地计算出和你哥哥一起吃晚饭的人是男性或女性的概率。如果有更多的信息出现,比如他朋友的名字叫帕特,他/她喜欢看冒险类电影和时尚杂志,贝叶斯法则就能进一步增加这个概率的准确度。

如何用贝叶斯法则进行性别判断?

20世纪90年代末,麻省理工学院的一位认知科学教授约书亚·特南鲍姆开始进行一项关于人们在日常生活中如何做预测的大规模研究。我们几乎每天都会遇到很多只需稍想一下就能回答的问题,例如预估会议要开多久、两条路线中哪一条更顺畅、全家出游去海边还是去迪士尼乐园。这些都在预测各种结果出现的可能性。我们也许并没有意识到这就是概率思维,特南鲍姆想了解我们的大脑在这个过程中是怎样运行的。

特南鲍姆的专业是计算机认知,主要研究计算机与人类信息处理方面的相似性。计算机是具有确定性的机器,只要你往计算机里输入可以比较海边和迪士尼乐园的好玩程度的具体公式,就能预测出你的家人是喜欢海边还是迪士尼乐园,而人类即使从未去过海边或者迪士尼,也能够做出类似的决定。因为根据过去的经验,一家人出去野营时,孩子们总是会抱怨,他们更喜欢看动画片,我们的大脑由此推断出,也许米奇高飞更能满足每个家庭成员的需求。

“我们的思维是如何从简单变复杂的呢?”特南鲍姆在2011年的《科学》杂志上写道,“每位父母都知道——并且经过科学家的证实——一般2岁的孩子通过大人举几个例子,就能学会使用像‘horse’(马)或者‘hairbrush’(毛刷)这样的新单词。”对于一个2岁的孩子来说,这两种事物有很多共同点:单词发音接近;从识字卡片上看两者都有长长的身体,还有很多直线(一种是腿,另一种是鬃毛);颜色也相似。不过,即使一个孩子只见过一次马的图片、用过一次毛刷,也能很快明白两个单词之间的区别。

对计算机而言,需要有明确的指令告诉它什么时候该用“马”、什么时候该用“毛刷”。比如,4条腿有可能是马,100根鬃毛则可能是毛刷。但是,儿童在学会说一整句话之前就有这种判断能力。“依靠感官输入的信息做出判断,这是一项了不起的技能。”特南鲍姆写道,“儿童是如何做到只通过一个或几个例子来掌握这些子集之间的界限的?”

换句话说,在不知道所有可能的结果的概率的情况下,为什么我们如此善于预测某类事情并做出决定?

为了回答这一问题,特南鲍姆和他的同事托马斯·格里菲斯设计了一项实验。他们在网上搜索不同种类的可预测事件的数据,比如一部电影可以获得多少票房、一个人能活多久、一个面包需要烤多长时间。他们之所以对这些事情感兴趣,是因为如果把每一件事的多种可能性绘制成图表,就会出现一个明显的模式。比如,电影票房往往呈现出一个基本规律:每年都会有几部电影赚得盆满钵满,而大多数电影则票房成绩平平。

数学领域,这被称为“幂律分布”(power law distribution)。我们可以把某一年上映的所有电影的票房收入绘制成一张图:

把其他事件绘制成图表也会产生不同的模式。以人类的寿命为例,一个人的死亡概率在出生那年达到小高峰(因为一些新生儿会在出生后不久夭折),但是如果一个婴儿在出生后头几年能够存活下来,就有可能安然度过之后的几十年。接着,从40岁开始,人的死亡概率开始增加,50岁以后逐年升高,在82岁时达到顶峰。

人类的寿命符合正态或者高斯分布曲线,如下图所示:

大多数人都理解他们需要用不同的方法来预测不同的事件,比如电影的票房收入和人的寿命,尽管我们并不了解娱乐业的发展趋势或者医学数据。令特南鲍姆和格里菲斯好奇的是,人们如何能够无师自通地知道如何做这些预测。于是,他们搜集具有明显分布模式的事件,从票房收入、人类寿命到诗歌长度,再到国会议员的事业发展[依据厄兰分布(Erlang distribution)],以及蛋糕的烤制时间。

接着,他们让几百名学生根据给出的数据进行预测,数据如下:

一部电影目前的票房收入是6000万美元,它最终的票房收入是多少?

一个人今年39岁,他/她最终的寿命有多长?

一个蛋糕已经在烤箱里烤制了14分钟,还需要烤多久?

一个人已任美国国会议员15年,他的任期还有多长?

除此之外,学生没有获得其他任何信息,也不知道幂律分布或者厄兰曲线。在没有任何关于概率计算方法提示的情况下,要求他们仅根据上述数据进行预测。

尽管已知信息有限,这些学生的预测却准得令人吃惊,他们知道,票房收入已有6000万美元的电影属于大片,所以它很有可能再赚取3000万美元的票房收入。如果一个人能活到30多岁,就很有可能再活50年。如果一个人已任国会议员15年,他就很有可能再任职7年,因为在职是他的一种优势,不过能力再强的议员也可能受到政治形势的影响而下台。

如果问这些学生,他们是按照什么思维逻辑做出预测的,估计没几个人能说出来,他们只是给出自认为正确的答案。平均而言,他们的预测结果的准确率不到10%。事实上,特南鲍姆和格里菲斯把学生对每一个问题的所有预测结果绘制成图表后,发现分布曲线几乎完全符合他们依据网上数据得到的真正模式。

同样重要的是,每位学生显然明白不同的预测需要使用不同的推理方法。而且,他们虽然不知道为什么,但他们知道有关人类寿命的预测符合正态分布曲线,有关票房收入的预测则符合幂律分布。

一些研究者把这种凭直觉做预测的能力称为“贝叶斯认知”(Bayesian cognition)或者“贝叶斯心理学”(Bayesian psychology),因为如果让计算机做这样的预测,它必须利用贝叶斯法则的一种变化形式——一个数学公式,一般还需要同时运行几千个模型,并对比几百万个结果。[1]贝叶斯法则的核心理念是:即使只有少量数据,我们仍然能够通过提出假设并根据对事物的观察来修正这些假设,从而达到预测未来的目的。假设你的哥哥说他约了一位朋友共进晚餐,你可能会预测他要见的朋友有60%的可能性是一位男性,因为他的大多数朋友都是男性。现在,假设你的哥哥说和他一起吃晚餐的是他的同事,你也许会改变你的预测,因为你知道他的大多数同事都是女性。根据一两个数据,加上你自己的假设,用贝叶斯法则就可以准确地计算出和你哥哥一起吃晚饭的人是男性或女性的概率。如果有更多的信息出现,比如他朋友的名字叫帕特,他/她喜欢看冒险类电影和时尚杂志,贝叶斯法则就能进一步增加这个概率的准确度。

人类不需要费太多心思就能做出类似的计算,而且预测结果往往准确得令人吃惊。我们大多数人都从未学过有关人类寿命的精算表,但根据经验我们知道,蹒跚学步的孩子死亡是相对少见的事,而90岁的老人去世则是很自然的事。我们大多数人都不会注意票房数据,但我们知道每年都会有几部街谈巷议的电影,还有一大批上映一两周就会被下线的电影。所以,我们能够根据自己的经验做出有关人类寿命和票房收入的假设。而且,参加葬礼或者看电影的数量越多,我们的直觉就越敏锐。人类是神奇的贝叶斯预言者,尽管我们并没有意识到这一点。

不过,有时候我们也会出错。例如,特南鲍姆和格里菲斯请学生们预测一位已经在位11年的法老还能继续统治埃及多少年,大多数学生都认为法老类似于其他国家的统治者,如:欧洲国家的国王。很多人通过历史书籍电视得知,许多统治者都有早逝的命运;但一般来说,如果一位国王或者女王顺利地度过中年,他们通常会一直在位,直到去世。按照这个逻辑,特南鲍姆的学生认为法老也是这样。因此,学生们推测埃及法老还能统治这个国家23年。

如果是英国国王,这个预测就是准确的;但对于埃及法老而言,这个预测则是错误的。因为4000年前人们的平均寿命比较短。大多数法老如果活过了35岁,就被视为长寿。因此,正确答案是:一位统治埃及已有11年的法老有可能再统治这个国家12年,最后死于疾病或者古埃及常见的其他原因。

学生们的推理方法是正确的,他们直觉上认为法老的统治年限符合厄兰分布。但他们的假设——贝叶斯称之为“先验概率”(prior probability)或者“基础比率”(base rate)——是错误的。而且,因为他们对古埃及人寿命的预测是错误的,所以接下来的预测也受到了影响。

“我们能够根据很少的信息预测,再根据自己的经验调整预测结果,这真是了不起。”特南鲍姆对我说,“但前提是,我们一开始的假设是正确的。”

那么,我们怎样才能做出正确的假设?答案就是要有全方位的经验。我们的假设是以自己的生活经验为基础的,但构成我们经验的样本往往都存在偏差,因为我们往往更容易记住成功而非失败的经验。例如,我们大多数人通过阅读报刊和杂志了解商界,一般会选择去客流量大的餐馆就餐,倾向于看热门电影。问题在于,这种经验让我们更多地看到成功的案例。报刊和杂志会用更多版面报道市值10亿美元的创业公司,而非几百家破产企业。在去往常常人满为患的那家比萨店的路上,我们几乎注意不到那些门可罗雀的餐馆。换句话说,我们习惯于关注成功,所以我们频繁地预测成功的概率,因为我们做预测时所依赖的经验和假设来源于我们看到的成功,而不是那些我们视而不见的失败。

相反,很多成功人士则花大量时间寻找有关失败案例的信息。他们阅读报刊商业版面时,会关注那些破产的企业。他们和没有获得晋升的同事一起吃午餐时,会询问后者问题出在什么地方。他们在年终审查时,要求听到的不只是表扬的声音。他们会仔细检查信用卡对账单,想弄清楚存款为什么没有预期的那么多。他们下班回家后会总结当天出现的失误,而不是忽略那些不起眼的小问题。他们会问自己,为什么某次通话不像他们预想的那样顺利,或者自己在会议上的发言能不能再简洁一些。我们有着天生的乐观主义倾向,总喜欢忽略自己的错误,也不关注别人的小失误。但是,做出准确的预测需要依赖以生活经验为基础的假设。如果我们只关注好消息,就相当于在给自己设置障碍。

“最优秀的企业家能够很清醒地意识到只和成功人士交谈的危险,”曾参与GJP项目和从事创业心理学研究的加州大学伯克利分校唐·摩尔教授说,“他们热衷于花时间和那些失败的人相处,而我们大多数人都会对失败者退避三舍。”

这是学习如何更好地做决定的最重要的秘诀之一:正确的选择取决于我们对未来的预测。准确的预测要求我们接触尽可能多的成功和失败案例,我们只有分别坐在拥挤和冷清的剧院里,才能知道电影票房会怎样;我们只有花时间与儿童和老人相处,才能准确地预测出人的寿命;我们只有与表现优异和碌碌无为的同事交谈,才能培养敏锐的商业直觉。

这很难做到,因为成功的案例更容易吸引眼球。人们习惯于不向刚刚被解雇的朋友问会让他们尴尬的问题,也不愿意问同事离婚的原因。但是,要想获得基础比率,我们必须了解正反两个方面的信息。

所以,如果有朋友与升职的机会失之交臂,你要问他原因;如果一单生意失败了,你要打电话询问对方你哪里做得不好;如果你觉得今天过得很糟糕,或者对你的爱人恶语相向,不要只是简单地告诉自己一切都会好起来,而要逼着自己弄清楚到底出了什么问题。

接下来,你可以用这些信息预测未来,当然你永远都不可能百分之百地预知事情的结果是什么。但是,关于未来的可能性,你想象得越多,就会越清楚哪些假设是正确的,哪些是不正确的,下一次就越有可能做出正确的决定。

安妮在读研究生时就对贝叶斯法则深有了解,她把这种方法用在了玩纸牌游戏上。“如果对手是我以前没见过的人,我做的第一件事就是思考基础比率。”她对我说,“对于不知道贝叶斯法则的人来说,我玩牌的方式好像带有偏见。如果我坐在一位40岁左右的商人对面,我会假设他在意的是让他的朋友们知道他与之较量的是一个职业玩家,而且他不太在乎输赢,因此他会选择冒险;如果我坐在一位22岁身穿纸牌图案T恤的玩家对面,我会假设他是从网上学习的纸牌技艺,而且学习时间不长,赌资也比较紧张。

“然而,贝叶斯思维与偏见不同,因为我总是随时完善自己的假设。所以,比赛开始后,如果我看到那个40岁的玩家试图用大赌注吓退对手,那也许说明他是一个职业玩家,希望每个对手不要高估他;或者,如果那位20岁的玩家也采用这种玩牌方式,那可能表明他是有钱人家的孩子,根本不了解这样做的后果。我会花很多时间去更新我的假设,因为如果假设是错的,我的基础比率也是错的。”

安妮的哥哥出局后,冠军联赛的赛场上仅剩下两人:安妮和菲尔·海默斯。海默斯是纸牌游戏界的传奇人物,也是被称为“扑克顽童”的电视名人。“我就是纸牌界的莫扎特。”他对我说,“我可能比任何纸牌玩家都更善于读懂对手的内心。就像白法术,这是我的直觉。”

安妮坐在牌桌的一端,海默斯坐在牌桌的另一端。“我很清楚菲尔在那一刻是怎样看待我的。”安妮后来说,“他对我说过,我是一个没什么创造力的人,我主要是靠运气而不是智慧,他认为我在紧要关头不敢虚张声势。”(www.xing528.com)

这是安妮的一个策略,因为她想让菲尔认为她在虚张声势。吸引他押下大赌注的唯一方法就是让他相信她确实是在虚张声势,而实际上她并没有。要想赢得这次比赛,安妮需要诱使菲尔改变对她的假设。

然而,菲尔也有自己的计划,他认为自己的实力更强,也能够读懂安妮的内心。“我的学习能力非常强。”他对我说,“一旦我了解了对方的想法,我就能够掌控牌桌。”这可不是夸夸其谈,海默斯已经获得了14次纸牌锦标赛冠军。

安妮和菲尔的筹码几乎相同,在接下来的一个小时里,他们玩了一局又一局,势均力敌。菲尔一直巧妙地想让安妮上当,消磨她的耐性。

“我更愿意和你的哥哥打牌。”他说。

“没关系啊,”安妮对他说,“能进入决赛,我就很开心了。”

安妮4次用大赌注吓唬菲尔。“我想触碰他的底线,逼他说,‘见鬼去吧,她一局接一局地诈我,我要反击了。’”安妮说。但是,菲尔似乎不为所动,一点儿过激的反应都没有。

终于,安妮等到了她期待的牌局,发牌员发给她一张K和一张9,发给菲尔一张K和一张7。在牌桌中间,发牌员开出公共牌K、6、9和J。

菲尔知道自己有一对K,但不知道安妮有两个对——一对K和一对9,安妮也不知道菲尔手里是什么牌。

轮到安妮下注了,她往底池里放了12万美元的筹码。菲尔认为他手中那对K可能是牌桌上最大的牌,于是同意跟注。接着,安妮又押上了所有赌注,底池筹码到了97万美元。

轮到菲尔下注了。

他开始自言自语。“不可思议,”他大声说,“太不可思议了,难道她不知道我的牌有多好吗!我不知道她明不明白这一局有多重要。”

他突然站起来。

“我不知道,”他围着桌子边踱步边说,“我不知道,我对这一局的感觉不太妙。”他把自己的牌面朝下放在桌子上,选择退出牌局。

菲尔把他的一对K面朝上翻过来,让安妮知道他有一对K。安妮开始摊牌了,她随意地把一张牌翻了过来,让菲尔知道她有一对9,但没有向他展示她也有一对K。

“我想让他改变对我的假设,”安妮后来说,“让他认为我用一对9来吓唬他。”

“哇!你真的打算用一对9来赢我?”菲尔对安妮说,“你也太小瞧我啦,也许我不应该这么快就选择退出。”

他俩接着准备下一局的比赛,安妮有146万美元的筹码,菲尔有54万美元。发牌员发给安妮一张K和一张10,发给菲尔一张10和一张8,最先发出的公共牌是2、10和7。

菲尔有一对10,还有一张8,他的牌不错。安妮的牌比菲尔好一些,她有一对10和一张K。

菲尔押注45000美元,安妮加注到20万美元,这一举动带有攻击性,让菲尔开始相信安妮打算破釜沉舟,他认为安妮出牌的模式超出了他的想象。安妮再三虚张声势,诱使菲尔改变了对她的基础比率的假设。

菲尔看着桌上的筹码,他想也许他的那个关于安妮在紧要关头不敢虚张声势的假设是错误的,也许安妮正在使诈,也许她过于看好自己的牌。

“我押下我的全部赌注。”菲尔一边说,一边把筹码推到桌子中间。

“摊牌。”安妮说。

两位玩家把自己的牌翻了过来。

“天啊。”菲尔说,他看到他们两个都有一对10,安妮还有一张比他的8大的K。

发牌员接下来在桌子上放了一张公共牌7,两位玩家谁都没能占到便宜。

安妮站在那里,手托着脸颊。菲尔也站着,喘着粗气。“请给我一张8吧。”他说,那是唯一一张能够确保他不出局的牌了。然而,发牌员翻开最后一张公共牌:3。

安妮赢得200万美元,菲尔出局,比赛结束,安妮成为冠军。

后来,安妮说那次冠军联赛改变了她的人生,她从此成为世界上最著名的女性纸牌玩家。2010年,她又赢得了美国纸牌单挑锦标赛。目前,她保持着世界纸牌系列赛奖金的纪录,她赢得的奖金总计有400多万美元。她不再担心按揭贷款,不再无端地感到焦虑。2009年,她参加了一季《飞黄腾达》节目。拍摄前,她有点儿紧张,但并不严重。现在的她已经不再焦虑到崩溃,也不怎么参加纸牌锦标赛,而是把大部分时间放在讲座上。她给商业人士讲解如何培养概率思维,如何接受不确定性,如何用贝叶斯法则做出更好的决定。

“很多时候,纸牌比赛可以归结为运气。”安妮对我说,“就像人生,你永远不知道自己的下一个目标是什么。在我大二那年因心理问题而住院时,我根本想不到自己以后能成为职业纸牌玩家。但是,你必须接受人生的不确定性,我用这种方法赶走了焦虑。我们能做的就是学会如何做出最好的决定,并相信假以时日好运必然会降临。”

怎样才能做出更好的决定?一方面培养自己的概率思维,为了达到这个目的,我们必须迫使自己想象不同的未来,在大脑中浮现出相互矛盾的画面,并大量接触成功和失败的案例,培养一种知道哪些预测更有可能实现的直觉。

为了培养这种直觉,我们可以研究数据、玩纸牌之类的游戏、认真思考生活中潜在的失败和成功,或者帮助我们的孩子写下令他们焦虑的事,并耐心地通过计算概率来缓解他们的焦虑。构建贝叶斯思维的方法有很多种,比较简单的做法是,回顾我们过去的选择,并问自己:为什么当时如此确定就是这个结果?为什么我错了?

不管方法是什么,目标都是相同的:把未来看作多种可能性而不是注定的结果;明确你知道的和不知道的事;问自己哪个选择能够带来最好的结果。算命是不真实的,没有人能够百分之百正确地预测未来。但人们的问题在于,他们总想着避免做任何预测,极其强烈地渴望确定性,对未知的事物充满恐惧。

如果安妮没有离开学术界,那么这种方法还有意义吗?“绝对有,”她说,“如果你正在考虑做什么样的工作,能否支付度假的费用,或者需要存多少钱才能过好退休生活,这些都属于预测。”那些基本规则适用于各种预测。最擅长做选择的人,往往能够努力想象不同的未来,并把它们写下来,仔细思考,然后问自己:哪些是我认为最有可能发生的事?为什么?

任何人都能够学会如何做出更好的决定,在日常生活中对一些事做出预测。没有人能做到每一次预测都是正确的,但是通过练习,我们能够学会如何提高预测的准确性。

[1]贝叶斯法则源自1763年出版的数学家贝叶斯生前的手稿,在计算上非常复杂,几个世纪以来,统计学家缺少运行这种算法所需的工具,所以他们完全忽略了这一成果。然而,从20世纪50年代开始,计算机的功能变得更加强大,科学家发现他们能够用贝叶斯法则来预测他们过去认为无法预测的事件,比如战争爆发的可能性,或者一种药物普遍有效的概率——即使只有少数人参与这种药物的临床实验。不过即使在今天,在某些情况下,计算机仍然需要花几个小时来绘制贝叶斯概率曲线。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈