首页 理论教育 大数据时代的数学思维力量

大数据时代的数学思维力量

时间:2023-11-16 理论教育 版权反馈
【摘要】:看看王友法(音)与合作伙伴完成的“肥胖”研究项目,我们就能猜到这个问题的答案。该研究还给出了超重美国人的精确占比,在这项研究中,超重的定义是体重指数超过25。例如,黑人超重的比例低于美国人的平均水平,更重要的是,他们当中超重人口的增长速度是美国超重人口平均增长速度的一半。求取平方和的做法似乎与毕达哥拉斯的研究方法不谋而合。为了避免本书中反复出现“超重或肥胖”这样的字眼,我把它们统称为“超重”。

大数据时代的数学思维力量

到2048年,到底会有多少美国人超重呢?看看王友法(音)与合作伙伴完成的“肥胖”研究项目,我们就能猜到这个问题的答案。美国国家健康和营养调查(NHANES)选择大量有代表性的美国人作为样本,跟踪调查他们的健康数据,内容涉及听力衰退、性传播疾病等多个方面。该研究还给出了超重美国人的精确占比,在这项研究中,超重的定义是体重指数超过25。[6]毫无疑问,在最近几十年内,美国人的超重现象越来越普遍。20世纪70年代初,体重指数超过25的美国人不足半数,到90年代初,这个数字接近60%,到2008年,几乎有3/4的美国人都超重了。

我们可以用反映导弹在垂直方向上的飞行路线的方式,将肥胖的普遍程度随时间发生的变化绘制成图:

据此我们可以进行线性回归,其分析结果大致为:到2048年,这条线会越过100%。

因此,王友法在论文中断言,如果这种趋势继续下去,到2048年,所有美国人都会超重。但是,这种趋势不会也不可能继续下去。否则,到2060年,超重美国人的占比将达到109%。

在现实中,超重人口将不断增加,其走势如下图所示,可表示成朝100%接近的曲线。

万有引力的作用下,导弹的飞行路线呈抛物线状,而超重人口的增长态势并不遵从某种严格的规则,不过与医疗卫生领域的研究结果一样,其轨迹也接近于抛物线。超重人口的比例越高,未来体重可能超重的人就越少,因此超重人口的比例向100%靠近的速度越慢。实际上,在100%以下的某个时候,增长曲线可能会变成水平线。我们身边总会有瘦子,实际情况也确实如此。仅仅过了4年,NHANES的分析结果表明,超重人口比例的增长速度就已经慢下来了。

但是,《肥胖》杂志刊登的这篇文章还掩盖了人们在数学常识方面犯下的一个更严重的错误。线性回归易于操作,一旦尝试过,就会乐此不疲,因此,王友法及其合作伙伴将他们收集的数据按照种族与性别进行分组。例如,黑人超重的比例低于美国人的平均水平,更重要的是,他们当中超重人口的增长速度是美国超重人口平均增长速度的一半。如果我们将黑人的超重人口比例叠加到美国的超重人口比例之上,再结合王友法及其合作伙伴所做的线性回归,就会得到下图:

黑人们的情况多棒啊,他们要到2095年才会全体超重,在2048年,黑人超重人口的比例为80%。

看出其中存在的问题了吗?如果全体美国人在2048年都会超重,那么美国黑人中那1/5的不超重的人在哪里呢?难道被放逐到海外了吗?(www.xing528.com)

在这篇论文中,这种基础性矛盾竟然无人提及。这样的流行病学分析跟上文所说的水桶中还剩-4克水的计算结果没有任何区别,简直毫无意义!

【注释】

[1]在本例中,是否“最接近于”,可通过下列方法衡量:我们用根据该直线估算的学费取代各校实收学费,然后针对各所学校计算出估算学费与实收学费之间的差额,求取所有差额的平方和,得到的数值可以表示直线偏离所有点的情况,最后选取该数值为最小值的那条直线。求取平方和的做法似乎与毕达哥拉斯的研究方法不谋而合。事实上,线性回归中隐含的几何学原理从本质上讲就是勾股定理,只不过被移植、升级到一个维数高得多的领域罢了。但是,要解释其中的道理需要进行更多的代数处理,限于篇幅,这里不展开讨论。不过,读者可参阅第15章中对相关性与三角学的讨论。

[2]该书于1883年出版。——编者注

[3]1英里≈1.609千米。——编者注

[4]他们的这个观点使我想起了奥森·斯科特·卡特(Orson Scott Card)的短篇小说《无伴奏之奏鸣曲》(Unaccompanied Sonata)。小说的主人公是一个音乐天才,人们担心他的独创性遭到破坏,便使这个音乐天才与外界完全隔绝开,不让他知道世界上的其他任何音乐。但是,一个家伙潜入他的住所后,给他播放了巴赫的作品。看管的人知道这件事后,剥夺了这位音乐天才接触音乐的权利。后来,这位天才的双手好像被砍掉了,眼睛也被刺瞎了。显而易见,奥森·斯科特·卡特对于惩罚与肉体伤害有一种奇怪的先天情结。不管怎么说,这篇小说告诉我们,不能因为巴赫是位伟大的音乐家,就试图阻止年轻的音乐人听巴赫的作品。

[5]威廉姆斯是20世纪美国最负盛名的几个诗人之一,与象征派和意象派联系紧密。

[6]在研究文献中,“超重”指“体重指数为25~30”,“肥胖”指“体重指数为30及以上”。为了避免本书中反复出现“超重或肥胖”这样的字眼,我把它们统称为“超重”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈