首页 理论教育 大数据时代,魔鬼数学让你中大奖!

大数据时代,魔鬼数学让你中大奖!

时间:2023-11-16 理论教育 版权反馈
【摘要】:中奖号码完全是随机产生的,因此每张彩票的中奖概率是相同的。投资股票的方差比较大,有可能获利更多,但也有可能损失更多。无论你是否承认,如何处理方差问题都是理财的一大难点。但是,如果在天然气与技术股票中各投一半的钱,一类股票与另一类股票不可能同时发生数额较大的买进卖出交易,这种投资组合的方差就比较小。

大数据时代,魔鬼数学让你中大奖!

效用这个概念有助于我们了解“Cash WinFall”彩票游戏的令人疑惑之处。杰拉德·塞尔比博彩团队购买大量彩票的方法是,利用电脑上的“快速选号器”(Quic Pic),随机选取彩票号码。而哈维的“随机策略”团队则是自己动手选号,这就意味着他们需要手工填写几十万张彩票,然后逐一输入便利店的计算机中。后者的工作量很大,而且极其枯燥乏味。

中奖号码完全是随机产生的,因此每张彩票的中奖概率是相同的。总体来讲,塞尔比利用快速选号器选出的10万组彩票号码,与哈维及卢玉然自己手动选号产生的10万组号码,为各自团队赢得的奖金应该一样多。从效用的角度来看,“随机策略”团队的大量艰辛工作并没有得到额外的回报,这是为什么呢?

我们考虑一个与其性质相同但更简单的例子。给你5万美元,或者让你各有50%的机会输掉10万美元和赢得20万美元,我们会选择哪一种方案呢?第二种方案的期望值为:

1/2×(-100000)+1/2×200000=50000美元

结果与第一种方案相同,因此我们可以认为这两种方案没有多大区别。如果多次选择第二种方案,那么几乎可以肯定,你赢得20万美元与输掉10万美元的次数会各占一半。假设输赢交替出现,那么两次之后,你会赢20万美元、输10万美元,净赚10万美元;4次之后净赚20万美元;6次之后净赚30万美元,以此类推。平均每次的利润是5万美元,这与第一种方案的结果一模一样。

现在,假设你不是经济学教科书应用题中的人物,而是一个手头没有10万美元的真实的人。那么,在第一次赌输之后,赌注登记人(假设这个赌注登记人是一个身材魁梧、脾气暴躁、力大无比的光头佬)找你要钱时,你可不可以告诉他:“请稍等,根据期望值计算结果,我继续玩下去就很可能有钱给你了?”尽管从数学角度讲确实如此,但在现实生活中这显然是行不通的。

如果你是一个真实世界中的人,你应该选择第一种方案。

上述推理过程可以依据期望效用理论清楚地表现出来。如果我有一家资金无穷多的公司,损失10万美元可能没什么大不了的(假设它的价值为-100个效用度),而赢得20万美元会给我带来200个效用度。在这种情况下,美元与效用度之间呈现出完美的线性关系,1个效用度就代表1000美元。

但是,如果我是一个积蓄不多的人,计算方式就会截然不同。赢取20万美元对公司来说意义不大,但却会改变我的生活,因此,它对我的价值更大,比如,它值400个效用度。但是,因为输掉10万美元不会让我的银行账户见底,于是我吞下了脾气暴躁的光头佬抛出的诱饵,结果输掉了赌注。这不仅很糟糕,还可能会对我造成严重的伤害。我们可以给这个结果赋予-1000个效用度,此时,第二种方案的期望效用为:

1/2×(-1000)+1/2×400=-300

期望效用为负值,意味着我不仅没有拿到唾手可得的5万美元,而且还要承受更糟糕的结果。50%的一败涂地的后果是我们根本无法承受的,如果没有赢大钱的希望,我们是不会选择第二种方案的。

以上,我们运用数学方法证明了一个我们已知的法则:钱越多,你所能承受的风险也越大。第二种方案就像冒险的股票投资一样,收益的期望值为正值。如果你多次进行此类投资,可能某几次会输钱,但是从长远看,你将会成为赢家。有钱人有足够的资金储备,可以承受偶尔失利造成的损失,并且通过继续投资,最终变得更有钱。

即使资产不足以承受损失,冒险的投资行为也并非完全不可为,前提条件是你得有备用计划。如果某个市场行为有99%的概率赚100万美元,有1%的概率赔5000万美元,那么你是否会采取行动呢?这个市场行为的期望值为正值,似乎是一个很好的投资策略。但是,一想到有遭受巨额损失的风险,而且小概率事件特别难以把握,你也有可能会畏缩不前。专业人士把这种行为称作“火中取栗”,在大多数情况下,可能会小赚一笔,但是稍有疏忽就会倾家荡产。

你到底应该怎么做呢?一种战略是拆借大笔资金,确保金融资产达到所冒风险的100倍。这样,你很有可能赚取1亿美元。(太棒了!)如果惹祸上身,亏损50亿美元,那怎么办呢?千万不要出现这个结果,因为我们生活在牵一发而动全身的世界,全球经济就像由锈蚀的钉子与腐烂的绳子搭建而成的摇摇欲坠的巨型树屋,一个部位出现大面积坍塌,整个树屋就很可能会轰然倒塌。因此,美国联邦储备委员会做了精心部署,以防此类情况发生。老话说得好:“如果你欠了100万美元,那是你自己的问题;但是,如果你欠了50亿美元,那就是政府的问题了。”

这个金融战略极具讽刺意味,但却十分有效。根据罗杰·罗文斯坦(Roger Lowenstein)在其著作《营救华尔街》(When Genius Failed)中的翔实记载,20世纪90年代,这个战略为长期资本管理公司做出了贡献。此外,在2008年金融危机中,一些公司也依靠这个战略存活下来,甚至实现了赢利。从目前看,局面不会发生重大变化,因此,这个战略仍然会继续起作用。[1]

人与金融公司不同。大多数人,即使是有钱人,也不喜欢采取不确定性的行为。有钱的投资人可能会心情愉快地选择期望效用为5万美元、有50%的概率获利的第二种方案,但是他们可能更愿意选择第一种方案,直接拿走那5万美元。与之相关的专业术语叫作“方差”(variance),表示某个决策结果的分布范围以及出现极端结果的可能性。如果两个方案的期望经济价值相同,那么大多数人,特别是流动资产有限的人,会倾向于选择方差较小的方案。因此,尽管从长远看,股票的回报率更高,但有的人却选择投资收益稳定的市政公债。投资股票的方差比较大,有可能获利更多,但也有可能损失更多。

无论你是否承认,如何处理方差问题都是理财的一大难点。正是因为考虑到方差问题,你才会通过共同基金进行多元化投资。如果把所有的钱都投到石油与天然气股票上,一旦能源领域遭受大的冲击,所有资金就会付诸东流。但是,如果在天然气与技术股票中各投一半的钱,一类股票与另一类股票不可能同时发生数额较大的买进卖出交易,这种投资组合的方差就比较小。你希望把鸡蛋放到尽可能多的篮子中,所以,你把积蓄委托给大型指数化证券投资基金,因为它们的投资无处不在。波顿·马尔基尔的《漫步华尔街》(A Random Walk down Wall Street),就很青睐这种投资策略,它的业绩一般,但却非常稳健。如果拿退休基金狂赌一把,会有什么结果呢?

股票的价值会增长,至少从长远看是这样的。换言之,投资股票市场的收益期望值是正值。对于收益期望值为负值的赌博行为而言,微积分计算的结果往往会令人抓狂。人们对肯定亏损的行为的憎恶程度,不亚于他们对肯定赢利的行为的渴望程度。在后一种情况中,你会青睐大方差,而不会追求小方差。所以在轮盘赌游戏中,人们不会气定神闲地走上前,然后在每个号码上押下一枚筹码。要送钱给庄家的话,无须采取这种复杂的行为。

那么,这些跟“Cash WinFall”彩票有什么关系呢?我们在前面说过,无论我们选择哪些号码,10万张彩票价值的期望值都不会改变。但是,方差的情况就不同了。假设我决定大幅增加赌注,但是采用不同的方式——购买10万张号码组合相同的彩票。

如果这组号码在开奖时与大奖号码有4个数字相同,我就非常幸运地成为10万张“6中4”彩票的持有人,我会把140万美元的奖金悉数收入囊中,利润率为非常可观的600%。但是,如果这组号码没有中奖,我花费20万美元买的彩票就成了一堆废纸。这是大方差的赌法,遭遇大额损失的概率很大,获利的概率很小,但是一旦获利,就可以大赚一笔。

因此,“别把所有的钱都押在同一组号码上”这条建议非常好,分散下注的效果要好得多。塞尔比团队用快速选号器随机选取号码,也是这个道理吗?

两者并不完全相同。首先,尽管塞尔比没有把所有钱都押在同一组号码上,但是他经常一号多投。乍一看,这种做法似乎非常奇怪。在最活跃的时候,每次开奖前他会购买30万张彩票,让计算机在接近1000万组号码中随机选取。既然他购买的号码组合在总数中仅占3%,为什么他还要一号多投呢?

有这样一个老掉牙的打赌方法:让出席派对的宾客们赌房间中是否有两个人的生日在同一天。派对的规模不能太小,比如说30个人。30个生日在365个可选日期中所占的比例并不是很大,因此我们可能会认为其中有两个人生日正好在同一天的可能性非常小。但是我们需要考虑的相关量并不是人数,而是人们可以组成多少个两人组合。不难算出,30个人可以组成435个不同的两人组合,每个组合中的两个人生日在同一天的概率是1/365,因此,在这个规模的派对上,很有可能有两个人的生日在同一天,这样的两人组合甚至会有两组。事实上,在30个人中,有两个人的生日在同一天的概率超过70%,这已经非常高了。如果从1000万组备选号码中随机选取30万组号码,同一组号码被购买两次的概率非常接近于1。如果要求我准确地说出这个概率,我宁愿说“这是一种必然”,也不愿意去数“99.9%”的小数点后面到底有多少个9。

而且,不同的地方不仅仅在于号码重复。我们采用一如既往的做法,让数字变得很小,以便更直观地了解其中的区别。假设抽奖时仅有7个球,彩票中心从中选取3个构成头奖号码组合。这样,我们一共有35种可能的头奖号码组合,对应从集合“1、2、3、4、5、6、7”中选择3个数字的35种方法。我们把这35个号码按照数字顺序排列如下:

假设杰拉德·塞尔比来到便利店,利用快速选号器随机购买了7张彩票,那么他中大奖的概率会非常小。但是,在这种彩票游戏中,只要押中3个数字中的两个,也能中奖。

猜中3个数字中的两个是很容易的。每次都说“猜中3个数字中的两个”非常麻烦,因此我们把这种情况简称为“二等奖”。例如,如果大奖号码是1、4、7,含有一个1、一个4以及7以外的其他数字的4张彩票就都中了二等奖。除了这4张彩票以外,还有4张彩票猜中了1、7,以及4张彩票中了4、7。因此,在全部35张彩票中,有12张中了二等奖,中奖概率超过1/3。这说明杰拉德·塞尔比购买的7张彩票中可能至少有两张中了二等奖。我们可以准确地计算出塞尔比的中奖情况:

没中二等奖的概率是5.3%;

只有一张彩票中二等奖的概率是19.3%;(www.xing528.com)

有两张彩票中二等奖的概率是30.3%;

有3张彩票中二等奖的概率是26.3%;

有4张彩票中二等奖的概率是13.7%;

有5张彩票中二等奖的概率是4.3%;

有6张彩票中二等奖的概率是0.7%;

所有7张彩票全部中二等奖的概率是0.1%。

因此,中二等奖的彩票数量的期望值为:

5.3%×0+19.3%×1+30.3%×2+26.3%×3+13.7%×4+4.3%×5+0.7%×6+0.1%×7=2.4

詹姆斯·哈维在购买彩票时没有使用快速选号器,而是手动选择了7张彩票。这7个号码组合为:

124

135

167

257

347

236

456

如果大奖号码为1、3、7,哈维就中了3个二等奖:135、167和347。如果大奖号码是3、5、6呢?哈维还是中了3个二等奖:135、236和456。以此类推,我们很快就会发现他选的这些号码组合有一个非常值得关注的特性:他要么中了大奖,要么正好中了3个二等奖。7张彩票中有一张中大奖的概率是1/5,即20%。因此,他的中奖情况为:

没中二等奖的概率为20%;

有3张彩票中二等奖的概率为80%。

哈维中二等奖的彩票数量期望值为:

20%×0+80%×3=2.4

结果与塞尔比的相同,这是必然的,但是其方差却比塞尔比的小得多。由于哈维对自己能中二等奖的彩票数量比较确定,因此他的投资组合对潜在合伙人的吸引力非常大。特别需要注意的是,如果哈维没有中3个二等奖,他就会中大奖。这说明哈维的策略可以保证他的彩票中奖金额比较可观,而这是塞尔比等使用快速选号器的玩家做不到的。自己选号可以在保证中奖概率的同时规避风险,但其前提条件是选对号码。

怎样才能选对号码呢?这可是一个价值连城的问题啊!(至少这一次是真的。)

你可以尝试用计算机来完成这项工作。哈维和他的合伙人都是麻省理工学院的学生,他们不费力气就能写出几十个代码行。为什么不编写一个程序,把“Cash WinFall”彩票的所有号码组合都筛选一遍,找出方差最小的选号策略呢?

这样的程序肯定不难编写,但问题是,在编写的程序处理完这些数据的冰山一角之前,宇宙中的所有物质与能量可能早已进入热寂状态了。从现代计算机的性能来看,30万并不是一个非常大的数字,但是,计划编写的程序处理的对象不是30万组彩票号码,而是从1000万组“Cash WinFall”彩票号码中选取30万组可能构成的集合。那么,一共有多少种可能的集合呢?这个数字大于30万,大于现存于世或者曾经存在的次原子微粒的数量,而且大得多,是我们闻所未闻的数字。

摆在我们面前的是在计算机科学中被称作“组合爆炸”(the combinatorial explosion)的可怕现象。如果你希望在美国50个州中为自己的公司选择最有利的驻地,这个目的不难实现,你只需要比较这50个州就可以了。但是,如果你希望找出穿行这50个州而且效率最高的路线,也就是所谓的“旅行商问题”(traveling salesman problem),就会发生组合爆炸,你所面临的困难将完全不在之前的数量级上,可供选择的路线一共有30千那由他(vigintillion)[2]条。

这下,组合爆炸真的发生了!

因此,我们必须另辟蹊径,找到可以减小方差的选号方法。如果我告诉大家,人们借助平面几何知识解决了这个难题,你们相信吗?

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈