首页 理论教育 魔鬼数学:大数据时代的数学思维

魔鬼数学:大数据时代的数学思维

时间:2023-11-16 理论教育 版权反馈
【摘要】:伯努利指出,这个悖论的关键问题在于,认为一个达科特的效用就一定是一个达科特。根据伯努利的理论,圣彼得堡悖论的期望效用应该为:1/2×1+1/4×2+1/8×3+1/16×4+……按列求和构成的级数就是伯努利用来解决圣彼得堡悖论时使用的求和算式,得数与倒三角形中各行算式得数的和相同,也等于2。

魔鬼数学:大数据时代的数学思维

在就无法明确其经济价值的事物(例如被浪费的时间、不愉快的聚餐等)做出决策时,效用度是一个非常有效的计量工具。其实,在就那些经济价值十分明确的事物(例如美元)做出决策时,我们也需要讨论它们的效用度。

概率论在其发展早期就发现了这个道理,同很多重要的观点一样,它也是以难题的形式进入人们的视野。1738年,丹尼尔·伯努利(Daniel Bernoulli)在论文“对一种风险测量新理论的阐述”(Exposition on a New Theory of the Measurement of Risk)中描述了一个著名的难题:“彼得正在抛硬币,他会反复做这个动作,直到落地时硬币的正面朝上。如果第一次抛投得到正面,他会给保罗一个达科特(ducat)[1];第二次抛投得到正面,给两个达科特;第三次给4个;第四次给8个。也就是说,抛投的次数每增加一次,彼得给保罗的钱就会翻一番。”

显然,这种游戏规则对保罗来说非常有吸引力,他应该愿意下赌注。但是,赌注该怎么定呢?根据我们的彩票研究,自然需要计算保罗从彼得处赢钱的期望值。第一次硬币落地时,正面朝上的概率是1/2,此时,保罗得到一个达科特。如果彼得第一次抛投的结果是反面朝上,第二次是正面朝上,这种情况发生的概率为1/4,此时保罗得到两个达科特。保罗要赢得4个达科特的话,彼得必须前两次抛投的结果都是反面朝上,而第三次抛投的结果是正面朝上,出现这种情况的概率是1/8。上述过程不断重复并累加,那么保罗赢钱的期望值为:

1/2×1+1/4×2+1/8×4+1/16×8+1/32×16+……

=1/2+1/2+1/2+1/2+……

这是一个发散级数,其得数不是一个固定值。加项越多,和越大,而且会不断增加,直至突破有限量的界限。这个结果似乎表明,保罗应该极力争取参与该游戏的权利,无论付出多少达科特都心甘情愿。

这看上去很傻,的确如此!不过,在数学推理告诉我们某个结论似乎很傻时,数学家们不会立刻弃之如敝屣,而是寻找数学推理或者直觉出错的地方。这个难题是丹尼尔·伯努利的堂兄尼古拉斯·伯努利在大约30年前提出来的,人们称之为“圣彼得堡悖论”(St.Petersburg paradox)。这个悖论难住了当时的多名概率学家,他们一直没有找到一个令人满意的答案。后来,丹尼尔·伯努利成功地解决了这个难题,他给出的答案非常有说服力,具有里程碑意义,它为经济学衡量不确定性的价值奠定了基础。伯努利指出,这个悖论的关键问题在于,认为一个达科特的效用就一定是一个达科特。有钱人手中的一个达科特,跟农民手中的一个达科特,两者的效用并不相同。这个道理是显而易见的,因为这两个人对他们手中金币的关心程度是不同的。而且,2000个达科特的效用并不等于1000个达科特的2倍,而是略少于后者的2倍。这是因为,如果某个人已经拥有了1000个达科特,再给他1000个达科特的话,这笔钱给他带来的效用,就比它给身无分文的人带来的效用小。达科特的数量加倍,不能理解为效用加倍。并不是所有的线都是直线,表现金钱与效用之间关系的那条线就不是直线。

伯努利认为,效用的增长方式与对数相似,因此,第k次的奖金为2k个达科特,它的效用是k个效用度。别忘了,我们可以大致把对数理解为数字的位数。伯努利的理论认为,有钱人衡量他们手中那一堆美元的价值时,考虑的是“美元”前面那个数字的位数。也就是说,拥有10亿美元的人比拥有1亿美元的人富裕,拥有1亿美元的人比拥有1000万美元的人富裕,两种情况下的效用差是相当的。

根据伯努利的理论,圣彼得堡悖论的期望效用应该为:

1/2×1+1/4×2+1/8×3+1/16×4+……

于是,该悖论就迎刃而解了。这个算式的和不再是无限大,而且数值也不是很大。我们可以利用下述方法,完美地计算其准确得数。

第一行算式1/2+1/4+1/8+……的值等于1,这就是我们在第2章讨论过的芝诺悖论算式。第二行算式与第一行相同,只不过每一项都要被2除,因此它的得数是第一行的一半,即1/2。同理,第三行算式中的每一项都是第二行的1/2,它的得数也必然是第二行的1/2,即1/4。以此类推,各行算式得数的和是1+1/2+1/4+1/8+……,它比芝诺悖论算式的值大1,即等于2。

但是,如果我们不是按行求和,而是按列求和,结果会怎么样呢?我在数家中立体声音响面板上的小洞时,无论横着数还是竖着数,都不会改变结果。同样,和就是和,也不会改变。[2]在第一列中,只有1/2这一个数字;第二列有两个1/4,即1/4×2;第三列有三个1/8,即1/8×3,以此类推。按列求和构成的级数就是伯努利用来解决圣彼得堡悖论时使用的求和算式,得数与倒三角形中各行算式得数的和相同,也等于2。因此,保罗应该下的赌注,就是两个效用度在他的个人效用曲线上所对应的达科特的个数。

对于效用曲线的形状,我们只知道它会随着钱的数量增加而向下弯曲,除此之外便一无所知。虽然当代经济学家与心理学家不断设计出越来越复杂的实验,但是,仍然无法准确地了解这条曲线的属性。(“现在,可以的话,请把头放在功能性核磁共振成像仪中,找一个舒适的位置。我马上让你看6张扑克牌,上面有6种方案,请按照吸引力由大到小的顺序排序。然后,不介意的话,请你保持这个姿势,我让我的博士后从你的口中取出唾液样本……好吗?”)

我们知道,对于不同情景中不同的人来说,金钱的效用也是不同的,所以,普适性的效用曲线根本不存在。这个事实非常重要,让我们在准备扩大经济行为的应用范围时做到(或者说应该做到)三思而后行。2008年,我们在第1章提过的对里根政府的经济政策略有溢美之词的哈佛大学经济学家曼昆,在一篇被人们疯狂转载的博客中解释说,如果实行奥巴马提议的增加所得税的政策,就会挫伤他的工作积极性。毕竟,曼昆已经在效用与金钱之间取得了某种平衡,一个小时的薪酬带给他的效用与一个小时无法陪孩子的效用正好相互抵消。如果每个小时的薪酬有所减少,那么对于曼昆而言,这种交换就不值得,因此他会减少工作时间,使自己的收入水平下降,直到他认为陪孩子一个小时的效用与一个小时的薪酬再次持平。里根从明星的立场看待经济政策,他认为在税率上调之后,明星们就会减少拍片数量,曼昆的观点与他一致。

但是,并不是所有人都与曼昆持相同的观点。更重要的是,人们心目中的效用曲线并不一样。讽刺作家弗兰·勒博维茨(Fran Lebowitz)讲过一个她年轻时在曼哈顿开出租车的故事。她说,每个月一开始她都会出车,但是一旦挣的钱足够支付房租和饮食开支,她就再也不出车了,这个月剩下的时间都会被她用于写作。对勒博维茨而言,超过某个限度之后,金钱带来的效用就基本为零了。因此,她的效用曲线看上去与曼昆的大不相同。在挣够房租之后,她的效用曲线就变成水平的了。如果所得税上升,对弗兰·勒博维茨会有什么影响呢?她不仅不会减少工作量,反而会延长工作时间,只有这样才能让她的收入足够支付房租和填饱肚子。

勒博维茨的效用曲线

曼昆的效用曲线

伯努利并不是唯一一个定义效用,并知道效用与金钱之间属于非线性关系的人,在他之前,至少有两位研究人员也取得了同样的成果:一个是日内瓦的加布里埃尔·克莱姆,另一个是与克莱姆通信的那位年轻人,也就是研究投针问题的布封。布封对概率的兴趣并不局限于那些客厅游戏,在晚年时期,他回忆起第一次接触令人头疼的圣彼得堡悖论时说:“这个问题困扰我很长时间,我一直没有找出症结所在。我发现,数学计算与普通常识在这个问题上相互冲突,除非我们从道德方面加以考虑。我把这个想法告诉克莱姆先生之后,他说我的想法没错,他还通过一个类似的方法解决了这个问题。”

布封的结论可以映射出伯努利的观点,而且布封对效用曲线的非线性特征的认识尤为深刻。

我们不能单凭金钱的数量估算其效用,因为金钱只是财富的一种符号。如果金钱就是财富,即财富带来的幸福与好处和金钱的数量成正比,那么我们有理由依据金钱的数量来估算其效用。但是,人们从金钱中得到的效用未必与金钱的数量成正比。对于有钱人而言,一笔10万埃居的收入带来的愉悦感并不会是1万埃居带来的愉悦感的10倍。而且,金钱的数量一旦超过某个界限,就几乎丧失了所有效用,不能使人们的愉悦感进一步提升。发现一座金山的人,未必比发现1立方英寻[3]金块的人更幸福。

期望效用理论简单易懂,可以帮助人们从多种选择中挑选出期望效用最高的那一个,因此它具有极强的吸引力。该理论还成功地捕捉到人类决策方法的很多特征,因此,一直以来都是社会学家在定量研究中使用的核心工具之一。1814年,皮尔·西蒙·拉普拉斯(Pierre-Simon Laplace)在他的著作《概率论》(A Philosophical Essay on Probabilities)的最后一页指出:“我们发现,概率论归根结底就是一种普通常识,只不过表现为‘微积分’这种形式。在我们做出某些选择或者某个决策时,概率论算无遗策,我们总可以借助它找出最有利的方案。”

这段话再次验证了一个观点:数学就是常识的衍生物。

但是,期望效用理论也不是万能的,它的复杂性再次引出了一个令人头疼的难题。这一次提出这个难题的是丹尼尔·埃尔斯伯格(Daniel Ellsberg),后来,埃尔斯伯格因为向媒体泄露五角大楼文件而为世人所知。(数学界的眼光有时比较狭隘,因此,在提到埃尔斯伯格时,有人说:“在他出政治问题之前,他还是做了一些非常重要的工作的。”这样的说法一点儿也不奇怪。)(www.xing528.com)

1961年,距离他后来暴露于公众视野还有10年的时间,埃尔斯伯格是兰德公司一位优秀的年轻分析师,是美国政府的核战争决策顾问,就如何防止或限制核战争等提供咨询意见。同时,他还在哈佛大学攻读经济学博士学位。无论是作为决策顾问还是作为博士研究生,他都需要深入思考人类在面临未知情况时的决策过程。当时,期望效用理论在决策数学领域拥有至高无上的地位。冯·诺依曼与摩根斯特恩在他们合作完成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)一书中写道,所有遵从某些规则或公理的人,在做出选择时似乎总希望使效用函数最大化。后来,与亚伯拉罕·瓦尔德同在战时统计研究小组的伦纳德·萨维奇对这个观点加以补充完善,指出这些公理就是在当时不确定条件下的行为标准。

如今,博弈论与期望效用理论仍然在人们及国家之间的谈判活动中发挥着重要作用。不过,这两种理论的重要性在“冷战”高潮期的兰德公司里被发挥到了极致,五角大楼非常重视冯·诺依曼与摩根斯特恩的著作,组织相关人员认真分析书中的内容。当时,兰德公司的研究人员正在研究人类生活中的某种基本活动:选择与竞争。从事博弈论研究的人,都获得了丰厚的奖金。

埃尔斯伯格这位年轻的超级明星特别热衷于打破常规。在以全班第三名的成绩从哈佛大学毕业之后,他加入了海军陆战队,当了三年步兵,这一举动让他的学术界同行大吃一惊。1959年,埃尔斯伯格作为“哈佛年轻学者”,在波士顿公立图书馆做了一个外交政策战略方面的报告,探讨阿道夫·希特勒(Adolf Hitler)在地缘政治战术方面的效率问题,并提出了一个有名的论断:“他是一位值得我们研究的地缘政治战术大师,从他身上我们可以了解到借助暴力手段希望实现以及能够实现的目标。”(埃尔斯伯格一直强调,他并不推荐美国采用希特勒式的外交战略,而只想心平气和地研究这些战略的有效性。他的话也许是真的,但是我相信人们听后肯定会非常愤怒。)

因此,埃尔斯伯格不满足于只接受主流观点。事实上,从写作本科毕业论文开始,他就一直在挑博弈论基础理论的错误。他在兰德公司设计的一个实验非常有名,现在人们称其为“埃尔斯伯格悖论”(Ellsberg's Paradox)。

假设一只瓮中装有90个小球,其中有30个红球,至于其他小球,我们只知道它们有的是黑色的,有的是黄色的。埃尔斯伯格规定了下列4种下注方式:

红球:如果从瓮中拿出的小球是红色的,我们会得到100美元;否则,什么也得不到。

黑球:如果从瓮中拿出的小球是黑色的,我们会得到100美元;否则,什么也得不到。

非红球:如果从瓮中拿出的小球是黑色或者黄色的,我们会得到100美元,否则,什么也得不到。

非黑球:如果从瓮中拿出的小球是红色或者黄色的,我们会得到100美元,否则,什么也得不到。

在红球与黑球中,我们应该选择哪一种呢?非红球与非黑球相比,选择哪一种更有利呢?

埃尔斯伯格让实验对象做出选择,询问他们倾向于哪一种下注方案。结果,他发现实验对象大多选择红球,而不是黑球。对于红球,我们知道会有1/3的概率得到100美元;而对于黑球,我们不知道它的期望值是多少。对于非红球与非黑球,埃尔斯伯格发现实验对象更倾向于选择非红球,因为有2/3的概率赢钱。

现在,假设我们面临更复杂的选择:必须选择两个下注方案,而且不是任意选择,只能选择“红球与非红球”或者“黑球与非黑球”。既然我们觉得红球的胜算大于黑球,非红球的胜算大于非黑球,那么我们认为“红球与非红球”的选择优于“黑球与非黑球”,似乎是有道理的。

但是,问题出现了。选择“红球与非红球”意味着我们肯定能得到100美元,选择“黑球与非黑球”也是如此!如果两者毫无区别,为什么我们会觉得一个优于另一个呢?

对于支持期望效用理论的人而言,埃尔斯伯格的实验结果似乎非常奇怪。每种下注方案都肯定有一定数量的效用度,如果红球的效用大于黑球,非红球的效用大于非黑球,那么“红球与非红球”的效用肯定大于“黑球与非黑球”,但实际上两者是相等的。如果我们选择相信期望效用理论,那么我们必然会认为参与埃尔斯伯格实验的那些人在选择上出错了。他们要么不善于计算,要么因为注意力不集中而没有听清问题,要么是疯子。由于埃尔斯伯格询问的实验对象都是知名的经济学家与决策论研究人员,因此这个结果就演变成了现在摆在人们面前的这个难题。

埃尔斯伯格认为,这个悖论的答案非常简单:期望效用理论是不正确的。后来,唐纳德·拉姆斯菲尔德说,有的未知信息是已知的,有的未知信息是未知的,应该用不同的方法去处理它们。红球属于“已知的未知信息”(known unknown),因为我们并不知道会拿到哪种颜色的球,但是当我们希望拿到这种颜色的球时,我们可以定量分析成功的概率。而黑球则不同,对于玩家来说它属于“未知的未知信息”(unknown unknown),因为我们不仅不确定可以拿到黑球,而且根本无法计算出拿到黑球的概率。在决策理论文献中,前者被称为“风险”(risk),后者则被称作“不确定性”(uncertainty)。风险可以进行定量分析,但是对于不确定性,埃尔斯伯格认为无法使用形式主义的数学分析方法,至少不可以使用兰德公司青睐的那种数学分析方法。

效用理论具有令人难以置信的效用,它可以处理这两种未知信息。在很多情境中,例如彩票游戏,我们面对的疑团是各种风险,其发生概率非常明确;但是在更多情况下,展现在我们眼前的却是“未知的未知信息”,不过这类未知信息的作用并不是很大。我们可以看到,在数学方法特有的推动作用下,关于这类信息的研究正在向科学领域靠拢。伯努利与冯·诺依曼等数学家构建了形式主义,为探究这些到目前为止人们缺乏了解的领域指明方向。像埃尔斯伯格这样数学思维敏捷的科学家则刻苦钻研,以期了解其中的局限性,在可能的时候提出完善与改进的措施;如果无法改进,他们就会发出措辞严厉的警告。

埃尔斯伯格的论文不像技术性很强的经济学论文,其文风生动活泼。在结尾段落,他评价了他的实验对象:“依据贝叶斯推理或者萨维奇公理做出的预测是错误的,根据这些预测做出的选择也是不正确的。他们蓄意违背公理,毫无歉意,而且他们似乎认为这是明智的行为。显然,他们错了,难道不是吗?”

“冷战”时期,决策论与博弈论在华盛顿与兰德公司备受推崇。当时人们认为,既然原子弹在上一次世界大战中帮助我们取得了胜利,决策论与博弈论这两个科研工具也会帮助我们打赢下一次世界大战。这两个工具在应用方面可能的确存在某种局限性,尤其当无先例可循而无法估算概率(比如人类遭受核打击瞬间化为放射性灰尘的概率)时更是如此,这个特点至少在埃尔斯伯格看来会有点儿麻烦。是不是数学上的分歧导致埃尔斯伯格对军事机构心存疑虑呢?

【注释】

[1]达科特是占时在大部分欧洲国家流通的金币。——译者注

[2]请注意,根据这种直觉推理求无穷级数的和是非常冒险的做法。在本例中,这个方法是可行的,但是在求更复杂的无穷级数的和时,尤其当各项有正有负时,常常会导致严重的错误。

[3]1立方英寻≈6.118立方米。——编者注

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈