到目前为止,本书主要探讨了同质化、统治型团队的动态反应机制以及回声室效应的危害,还分析了外部思维和重组式创新的重要性。现在我们知道,如果能真正理解多样性,那就可以解释很多“知其然而不知其所以然”的事情,比如中情局的失败,比如提出建设性异议的好处,等等。
在这一章中,我们将从一个全新的视角来审视多样性。我们会看到,如果人类对自身的理解存在概念性的谬误,那么多样性的作用就会受到严重破坏,这将阻碍企业、机构和整个社会充分发挥其潜力。而事实上,这种概念上的谬误已经渗透到了很多科学领域的分支。
要充分理解造成这种谬误的根源及其产生的影响,还需要做一些深入的挖掘。我们可以从一个最令人困惑的现象说起,那就是在饮食和营养方面“公说公理,婆说婆理”的各种建议。这可能看上去和多样性科学没什么关联,也和我们前面谈到的内容相去甚远。但不同饮食建议的分歧其实阐明了我们世界中一个问题的重要侧面,对我们的未来也会产生巨大影响。
*
伊兰·西格尔感到很困惑,或者更准确地说,他已经不知所措。对于一位从斯坦福大学获得博士学位的杰出科学家来说,这种感觉并不令人愉快。不过,只要花过几分钟时间去思考饮食和营养之间关系的人,都会对他的困惑感同身受。我们知道饮食对健康长寿有很大影响,但事实却没有那么简单。
读大学的时候,西格尔很喜欢打手球,吃得也很健康,但体重却超标50磅。23岁时,他在一个派对上认识了后来的妻子凯伦。凯伦是一位临床营养师,掌握着最先进的科学知识。她遵循美国饮食协会的指导方针为西格尔做营养餐,里面搭配了很多新鲜蔬菜,然而西格尔的体重丝毫未变。
西格尔告诉我,后来他就决定不再遵循这些指导方针,并且想要弄清楚其背后的科学依据到底是什么。他说:“我没想到会是这样,很多研究都是基于很小样本的人群,调研资金也是由一些食品公司提供的。这不能不让人产生怀疑。难道这些研究并不如我想的那样严谨?”[1]
凯伦笑了起来:“他通常都是一个随和的人,但对数据就会钻牛角尖,这对他来说真的很重要。”
或许最让伊兰·西格尔惊讶的是,很多研究结果都互相矛盾。有的研究呼吁低脂肪饮食,有的则鼓吹高脂肪饮食。不少畅销书大肆宣扬所谓的原始人饮食法、地中海饮食法、亚洲饮食法,或是这三种的结合,还有其他一些热门的懒人饮食法。消费者被五花八门的饮食方案吸引,又很快退烧。于是出版方就做些修改,然后让它们以另一种形式回归市场。
以碳水化合物为例。一些证据表明,低碳水化合物、高脂肪的饮食有益于健康;而另一些则表明,最好的饮食构成应该是低脂肪和高碳水。双方都有证据,从某种意义上说,等于双方都没有证据。这简直成了一个让人困惑的谜团。西格尔最开始也一头雾水,但他渐渐开始了对这一领域的深入探索。
西格尔有很强的好奇心,谈到自己的探索之旅时,他的眼里闪着光芒。他和凯伦还有三个孩子住在一起,家里养着一只叫斯诺的狗和一只叫小蓝的猫,生活简单而平凡,这跟其他同样被各种饮食建议弄得云里雾里的人没什么差别。但是伊兰·西格尔具备一个巨大优势——拥有世界级的计算机水平(20多岁时他获得了著名的奥弗顿奖,该奖每年颁给一位年轻的杰出科学家),并且在世界顶级学术机构之一的魏兹曼研究所任职,这些条件足以帮他彻底找出谜底。西格尔对我说:
面对各种各样的饮食建议,很多人都会感到困惑,这一点也不奇怪。2012年,美国心脏协会和美国糖尿病协会建议人们喝无糖苏打水,以减轻体重、改善健康,于是无糖苏打水的销量大幅提升。但是随后的很多研究却表明情况恰恰相反。1977年,美国政府说摄入脂肪不好,应该摄入更多膳食纤维,于是人们都照做了。可男性肥胖者的人数还是增加了两倍,女性则增加了一倍。
这些话表明,他的兴趣不仅仅停留在理论研究的层面。实际上,饮食已经成为一个重大的公共问题。如果你住在美国,你有70%的概率体重超标,有40%的概率肥胖。英国的数据也类似。自1980年以来,全球人口的肥胖率翻了一番多。2014年,有超过19亿成年人(占世界人口的39%)体重超标,其中6亿人肥胖。西格尔指出:“那么多人被饮食建议搞得晕头转向,这肯定无助于肥胖症的遏制。节食的人常常体重反弹,其实很多证据都表明,节食反而会增加体重。”
一项针对美国电视台热门减肥节目《最大输家》进行的研究显示,参赛者通过运动和控制卡路里的摄入减掉了大量体重。然而,大幅减重的代价却是代谢功能的急剧下降。6年后,这些人的代谢变得极其缓慢,以至于根本不敢跟与他们体重相同但从未肥胖过的人摄入同样多的热量。科学家称这种现象为“持续代谢适应”,而这只是西格尔在研究时发现的几十种异常现象之一。他说:“很多人都知道一些公认的事实,譬如说饮食应该包括脂肪、盐、蛋白质、纤维、维生素和矿物质。但除了这些常识之外,我们几乎什么都不知道。”
西格尔在30多岁时开始参加马拉松比赛,他本想看看节食能否帮助提高跑步速度,可在这时又遇到了新的麻烦,因为专家给跑步者的饮食建议也同样互相矛盾。他说:
开始跑步那段时间,最重要的一件事就是比赛前“必须摄入碳水化合物”。一般来说,我会在比赛前一晚吃3碗意大利面,在赛前30分钟吃几个枣子或能量棒。起初我并没有质疑过这个建议,这是马拉松界的一条公理。但过了一阵子,我觉得还是应该好好研究一下。
可他越研究就越困惑:有人说碳水化合物都是一样的,有人则认为有“好”碳水化合物和“坏”碳水化合物之分。一项研究称在跑步前30到60分钟吃枣子能补充能量,而有一些人则觉得吃了以后反而体力下降,跑步过程中不得不停下来休息几分钟。
西格尔说:“我决定拿自己做个实验。有一天晚上我没吃意大利面,改吃有牛油果和坚果的高脂肪色拉。结果,第二天我连跑20公里没吃过任何东西。”这一情况和主流建议相矛盾,很多营养师甚至会说这样饮食是在自我摧残,但西格尔的确觉得自己比以往任何时候都更强壮、更健康、更精力充沛。他说:“我的能量值比摄入碳水化合物的时候要高,跑步后的饥饿感也消失了。我推断这是因为身体从燃烧碳水化合物转变成了燃烧脂肪,这改变了我的能量值,也就减轻了饥饿感。”
他曾在巴黎实现了3小时内跑完马拉松的壮举。2017年,他在维也纳又一次做到了这一点。然而,他仍没有实现自己的终极志向——悟透饮食科学。
“我不会放弃的,”他说,“这是一个必须破解的谜。”
20世纪40年代末,美国空军也遇到了一个难题。那是喷气动力飞行的早期,当时工程技术的可靠性已经达到了一个历史最高水平,但是空军却一次又一次遭遇事故。“那段时间事故频发,出问题的飞机非常多,可以说美国空军面临着一个生死攸关的迷局考验。”哈佛大学学者托德·罗斯写道。一位退休的飞行员称:“当时飞行真的很困难,你永远不知道飞机会不会栽进土里。”[2]
要了解问题的严重性,可以参考美国空军1950年2月的官方记录。在当月的第一天,出现安全问题的飞机就包括查尔斯·L.弗格森的C–82双引擎双吊杆运输机、曼德夫·特拉弗斯的P–51野马远程单座战斗机、马尔科姆·W.汉纳的德克萨斯教练机和赫尔曼·L.史密斯的波音B–29飞机。哈里·L.麦格劳、威廉·K.胡克和乔治·T.舒斯特这三位飞行员也遭遇了事故。值得注意的是,所有这些事情都发生在同一天——1950年2月1日,但从总体统计结果来看,这只是一个典型的24小时,事故次数并没有异常增多。同月的第二天共发生4起安全事故,第三天发生7起,第四天又发生4起,当月14日竟发生了16起。整个1950年2月,总共发生了172起事故。[3]
这究竟是怎么回事?问题似乎并不出在飞机的机械或电子系统上,因为工程师做了彻底检测,发现它们都运转良好。飞行员的水平也没有突然下降,他们都是训练有素的专业人士,在业内享有很好的声誉。
既不是设备问题,也不是飞行员技术问题,还能是什么呢?为了解开谜团,一位毕业于哈佛大学、专门研究体质人类学的专家展开了研究。这位名叫吉尔伯特·S.丹尼尔斯的中尉不是一名典型意义上的飞行员,他沉默寡言,说话轻声细语,做事有条不紊,学识渊博,爱好之一是园艺。在性格和兴趣上,他与伊兰·西格尔非常相似。丹尼尔斯产生了一种强烈的预感,他认为问题不在于设备故障或飞行员的判断失误,而在于驾驶舱本身的设计。
1926年,美国空军曾将数百名飞行员的身高等数据分类整理后,对驾驶舱的设计进行了标准化,也就是根据飞行员的平均身体特征来确定椅子的高度、人到踏板和操纵杆的距离、挡风玻璃的高度、头盔的形状,等等。空军内部的一些人认为,可能是自1926年以来飞行员的体型发生了变化,导致他们在操作控制台时十分不便。这会是事故频发的原因吗?丹尼尔斯有不同的想法,他认为问题不在于普通飞行员的体型变化,而是“普通飞行员”这一概念本身存在问题:也许世界上根本就不存在普通飞行员。
1952年,丹尼尔斯获得了验证自己直觉的机会。他在莱特帕特森空军基地负责一个项目,专门测量飞行员的身体尺寸。丹尼尔斯全身心地投入这项工作。他先仔细将4063名飞行员的数据按140个尺寸标准制成表格,包括拇指长度、胯部高度、飞行员眼睛到耳朵的距离等[4],然后找出他认为在驾驶舱设计中最重要的10个维度,并计算每个维度的平均值。换言之,他就是在用表格呈现出所谓“普通飞行员”的身体尺寸。
但有多少飞行员符合这些平均数?丹尼尔斯在计算时将尺度放得很宽,只要一名飞行员的数据在给定值的上下30%以内,则认为他符合平均数。比如,飞行员的平均身高是5英尺9英寸,那么只要这个飞行员的身高在5英尺7英寸到5英尺11英寸的范围内,就符合平均身高要求。
多数军事专家认为,大部分飞行员的身体尺寸都处于这10个维度的平均值范围之内,因为平均数就是从飞行员的身体尺寸数据中计算出来的。此外,正如托德·罗斯指出的那样,这些飞行员都曾经过预选,本来就符合要求的基本身体规格,空军不会去招募一名5英尺4英寸的飞行员。
但实际情况如何?有多少飞行员在10个维度的平均值范围之内?没有一个。在超过4000人的测试群体中,没有一个人符合平均值的要求。丹尼尔斯的预感得到了有力的证实,问题不是在于自1926年以来飞行员的平均体型发生了变化,而是根本就不存在所谓的“普通飞行员”。正如托德·罗斯所说:“一名飞行员可能手臂比平均长度长,但腿却比平均长度短。另一名飞行员可能胸部很大,但臀部很小。”即使丹尼尔斯在10种尺寸中只挑3种,比如脖子、大腿和手腕的周长,也只有不到3.5%的飞行员符合平均值要求。[5]
这怎么可能?没有一名飞行员符合平均值,这个发现看起来不合逻辑,让人匪夷所思。如果你测量一组人的某个平均值,其结果肯定能反映出这个群体中某些个体的情况,毕竟这个平均值是从所有个体样本中计算出来的!但事实证明,对平均值的关注会带来误导。以编织蚁的体长为例,有些编织蚁体型非常大,有些非常小,这意味着平均值根本无法反映个体情况。在某种意义上,这个平均数是不具代表性的,这种情况被称作“多峰分布”。
人类男性的身高数据则符合另一种分布样式——“钟形分布”,也就是说大多数人位于平均值附近。但是驾驶舱的设计不仅仅是基于身高,而且关乎人体的各个维度,包括胸围、臂长、腿长、躯干围等。你可能以为,一个人如果在某个维度上数据很大(比如颈围),那么他在另一个维度上数据肯定也很大(比如腰围),但实际上,数据之间并不存在这样的相关性。也就是说,任何在这些维度上取平均值的做法都会抹杀多样性。
以下图的两个人为例。如果只看图中这些维度的平均数,你会觉得这两个人的身材相差无几,但实际上左边的男人体重更重、身高更矮、肩膀更窄、脖子更粗、手臂更短、腰围更宽。如果把两人各自在每个维度上的数值综合加总,那么他们都符合平均水平。但是从任何一个单一维度来看,他们之间相差甚远。
我还可以用智商测试的例子来解释这一点。你可能以为,如果两个人的智商都是105分,那么他们在测量智商的各个维度——比如言语理解、解决问题的能力等方面都会非常相似。但正如托德·罗斯所说,这种关联度是很微弱的。某个人很有可能在逻辑推理方面分数很高、常识问答方面分数很低、言语理解方面成绩中等……单纯的分数不能反映出这些差异,甚至会掩盖差异。而检验一个人的综合表现时,其实最重要的就是那些细微的不同。[6]
丹尼尔斯的研究给人当头一棒。按照普通飞行员的标准来设计驾驶舱,可能听起来合乎逻辑,甚至很科学,其实却充满了潜在危险——这么高的事故率,这么多次坠机,正是标准化的驾驶舱设计造成的。这也迫使空军开始寻找一种新的设计方式,改变以往所谓的标准化设计。实际上,没有一个人可以套用这种标准,并将其转为一种能适应不同人的不同特征的设计。
果然,当飞行员可以自由改变座椅高度和操纵杆距离时,事故率开始骤降。再说,与事故带来的损失(更不用说人员伤亡)相比,创造这种灵活性的成本微乎其微。美国空军在安全性方面的表现迅速改善。
美国空军的标准化驾驶舱只是大千世界中被标准化建构的一个缩影而已。标准化的教育、标准化的工作安排、标准化的政策、标准化的药物,甚至还有标准化的心理学理论,所有这些都从不同方面忽略了人类的多样性本质,把人视作平均化产物,而不是鲜活的个体。这就将我们带回到本章开头讲的那个问题:标准化导致的缺陷会如何让我们忽略多样性,从而失去多样性带来的好处?
每个人都不一样。我们有不同的体格、不同的认知特征、不同的优势和劣势、不同的经历和兴趣,这正是人类最美妙的地方。如果差异性体现在一些重要的方面,那么一个开明的制度就应该考虑到这种差异。毕竟,如果每个人都被塞入僵化的系统(比如标准化的驾驶舱),如果每个决策者都被平均数迷惑,模糊了人与人的不同,那我们怎么能利用好多样性并从中获益呢?
我举个简单的例子来讲清这一逻辑。2014年,谷歌公司做了一个实验,让一组心理学家给销售和行政管理人员举办一场简短的研讨会。我们知道,销售和行政类工作通常都会以标准化的方式,在规定的时间段里用规定的工具来完成,并且这种标准化不仅是实体意义上的,也是观念上的。的确,想在这类工作中注入灵活性简直不可思议。毕竟他们都是销售人员和行政管理人员,又不是需要进行设计和创造的工程师。[7]
但研讨会鼓励这些专业人士不要把自己的工作看成固定不变的东西——就像标准化的机舱那样,而是要看作一件可以调节的设计品。心理学家们教这些销售和行政人员如何发挥自己的优势,如何基于自己的兴趣才能和公司的目标来构建工作的模式,一句话,让他们把自己看作具有独特技能和洞察力的个体,而不是机器中的某个齿轮。正如实验的主持者之一亚当·格兰特所说:
我们向数百名员工介绍了这样一个概念:工作不是静态的雕塑,而是灵活的积木。我们向他们展示了一些例子,让他们看到别人如何成为个人工作的设计师,如何个性化定制自己的任务和人际关系,以便更好地与自身的兴趣、技能和价值观保持一致。比如一名很有艺术天分的销售人员志愿设计一个新的标识,一个外向的金融分析师以视频聊天而不是电子邮件的形式与客户沟通……他们开始为自己的角色创造一个更理想但不脱离现实的新愿景。[8]
结果怎样?公司管理者和普通员工都认为,与对照组相比,参加过研讨会的人情绪更快乐、表现更出色,他们获得晋升或更佳跳槽机会的可能性高出70%。格兰特写道:“他们不仅能利用现有的才能,还主动开发新的技能,为自己创造了更具个性化的工作。他们变得更快乐、更高效,遇到适合的岗位时也更能胜任。”
我在前面章节里提到,取平均值是进行经济预测的有效方法。你应该记得,6位经济学家的平均预测结果要比1位顶尖经济学家的预测准确得多。然而在本章,我又说到取平均的做法不正确。那么应该如何理解这种差异呢?我的分析中有矛盾之处吗?
事实上,这两种观点不仅是相容的,而且是互补的。
经济学家用不同的模型做预测,并且独立说出自己的预测结果,然后你把这些不同结果平均一下,就可以在过滤掉错误信息的同时有效汇集不同观点。但标准化是迫使不同尺寸的人使用同一个尺寸的驾驶舱,或是无视人与人之间的区别,甚至在这种区别还没机会表现出来的时候就迫使人们用相同的方式工作。这就好比让经济学家都使用所谓的“普通经济预测模型”来工作,其结果就是差异性遭到抹杀。
换言之,将不同的预测结果平均化可以有效利用多样性,但是将人们的工作、学习或其他做事方式统一化,只会导致多样性被抹杀。就像亚马逊机器学习项目的主管尼尔·劳伦斯所说:“取平均的做法如果能得到有效利用,就可以帮助吸取不同人的思想精华,但如果使用不当,就意味着把一种解决方案强加到不同人的身上。”[9]
当然,标准化常常也是有价值的。以服装业为例,标准化的选择也许不能完美匹配不同人的身材,但能够降低成本,达到批量生产的目标,而定制服装则通常比较昂贵。总之,必须在定制和通用之间做一个取舍。不过,人们选择标准化的成衣倒不完全出于成本考虑,而是因为多数人很少会考虑细节的差异。驾驶舱也是这样,做标准化设计的初衷不是降低成本、提高效益,而是没有去想过其他方案的可能性。也就是说,在丹尼尔斯上尉之前,很少有人想到为普通飞行员设计的驾驶舱也许并不适合大部分飞行员。
在过于僵化的制度下,每个人都会受苦。围绕取平均的做法而形成的思维定式,使我们在难以察觉的情况下忽略了群体的多样性。这种思维定式的影响力很深,不仅在企业运作中是如此,甚至还渗透到了科学领域。
现在回到伊兰·西格尔的案例,你应该可以理解,为什么忽略多样性带来的问题比饮食问题本身还要严重得多。
*
伊兰·西格尔在低碳水化合物进食后成功地跑完一场马拉松,这次经历让他发现了饮食科学的缺陷。标准化的饮食指南就像标准化的驾驶舱,看起来很严谨,却忽略了一个关键变量——人的多样性。西格尔说:
一个很好的例子是所谓的血糖指数,这是一个根据食物对血糖的影响程度来对其进行排序的系统。获得血糖指数的方法是:让一组人吃不同的食物,然后测量他们的血糖反应,最后你就得到了一个从1到100的数值。[10]
听起来很科学、很严谨,因为这是一个在测量和数据基础上建立起来的评价体系。但是,它的建立依据还包括人们对食物的平均反应。如果人们对同一种食物的反应存在本质差异呢?这就意味着,对有些人而言,根据血糖指数进食并不健康。
2017年春天,西格尔和他的研究伙伴进行了一项实验,目的就是测试这种可能性。西格尔测量了人们吃下两种不同类型面包后的反应:一种是工业化生产的白面包,经常被健康专家们妖魔化;另一种是手工制作的全麦面包,那些极度推崇健康饮食的人都喜欢它。现有的医学测试结果互相矛盾,有些研究声称白面包可以降低患癌症、心血管疾病和2型糖尿病的风险,但也有研究结果说白面包对人体健康的临床指标几乎没有影响。
西格尔的实验非常简单。他找来一些身体健康且没有在节食的人,将他们随机分成两组。在实验的第一周,一组人每天吃白面包,另一组人吃全麦面包,两组人都不允许吃任何其他小麦制品,他们早餐只能吃面包,其他几餐中也按照需要吃一定量的面包。随后实验暂停两周,接着改成另一种饮食方式。
关键的是,实验中的每个人都会被多次测试对于面包的反应,项目包括炎症反应、营养吸收情况等,最重要的指标是血糖反应。
血糖对健康极其重要,值得花一两分钟来解释一下。我们吃了东西,身体就开始消化碳水化合物,把它分解成单糖并释放到血液中。从那时起,在胰岛素的帮助下,葡萄糖被转移到细胞和肝脏,在那里被用来合成糖原,成为日后身体需要的能量。同时,胰岛素也向细胞发出信号,将多余的糖转化为脂肪并加以储存,这是人体增重的主要原因。
如果过多的葡萄糖从食物中流入血液,就可能导致胰岛素过度分泌,使血糖水平过低,让人体产生饥饿感,这时即便已经摄入了足够多的食物,你还是会想要吃更多东西。血糖的急剧上升增加了代谢紊乱的风险,会让人患上糖尿病、肥胖症和心血管疾病等。一项对2000人进行了30多年的跟踪研究表明,高血糖预示着高死亡率,血糖水平长期过高会给整个机体系统带来巨大压力。另外,如果血糖水平保持稳定,仅在饭后适度升高,就可以降低心脏病、癌症、其他慢性疾病(如脂肪过多)和死亡的可能性。总之,血糖反应不仅对体重有很大影响,对健康也很重要。
西格尔的面包实验表明,两种不同的面包在包括血糖反应在内的很多指标上并无区别。也就是说,工业化生产的白面包和手工制作的面包几乎有着同样的效果。这就意味着饮食建议不该有所偏颇,如果一种面包并不比另一种好,为什么不建议消费者选择味道更好或者更便宜的那种呢?
然而,这种科学推断是基于人们的平均反应。我们应该如何评估个体的反应呢?人们的反应存在多样性吗?实验结果令人惊讶:有的人能够从食用全麦面包中获益,有的人则正好相反,还有些人对两者的反应几乎没有区别。西格尔说:“整个数据的集合呈现出了高度个性化的特征,你必须观察个体而不仅仅是平均值。”
为什么人与人的反应会如此不同?西格尔意识到,就像飞行员的体格有多个维度、共同决定着飞机驾驶舱是否合用一样,人体的多个维度也共同影响着对一顿餐食的反应,比如年龄、生活方式、基因,等等。
也许最吸引人的维度是微生物群,也就是在胃肠系统中寄居的细菌。我们的身体里有大约4万亿个细胞和上千种不同的微生物,微生物们形成了一个小型宇宙,拥有的基因数量大约是人类宿主的200倍,对食物的消化、营养素的提取和免疫系统的运作都有重大影响。并且,这些微生物群因人而异。
如果从这个角度来看待饮食,那么上文中说到的“多个维度”就可以理解为不同的酶、人体基因、细菌基因,也许还有几十种其他的特殊因素。由此可见,任何假设多数人甚至所有人都能套用的饮食建议是荒谬的。西格尔说:“我越想越觉得荒谬,标准化的饮食建议总是存在缺陷,因为它只考虑食物本身,而不考虑吃食物的人。”
西格尔的野心不止于此。
很多实验都是以一小群人为实验对象,对他们实施一些干预措施,然后在特定时间测量出平均值。西格尔的后续实验则招募了近1000个受试者,其中近50%的人超重,25%的人肥胖,符合发达国家非糖尿病人的人口结构。随后,这些受试者被连接到葡萄糖传感器上,整周时间里每5分钟测试一次,从而产生近5万个个体餐后血糖反应结果。[11]
受试者在一个特别设计的手机应用上记录下每一餐的情况。他们可以随心所欲地吃,但早餐必须标准化——一份由普通面包、黄油面包、果糖粉饮料和葡萄糖水组成的轮换菜单。这次实验收集了丰富的数据:以总计46898次自主选择的餐食和5107次标准膳食为样本,记录下各种健康数据。对于营养学实验而言,这是一个前所未有的案例。更重要的是,西格尔和他的同事并没有计算平均值,而是测试每一个人的不同反应。
最后的测试结果令人惊讶。比如,有的人吃冰激凌后会产生健康的血糖反应,吃寿司后血糖异常,有的人却正好相反。西格尔说:“针对每一项既有的医学或营养学结论,都会有一些人的测试结果与之大相径庭。人与人的身体真是千差万别。”(www.xing528.com)
西格尔的妻子凯伦也被实验结果震惊了。她是一位专业的临床营养师,在诊所里接待过几十个病人,一直按照常规的指导方针提供建议,比如对于糖尿病前期患者,建议他们不要吃冰激凌,改吃大米之类的碳水化合物。凯伦说:“我现在意识到,我给病人的建议可能反而会害了他们。这真是当头一棒。现在我建议病人先测量自己的血糖反应,根据结果才能制定真正适合他们自己的膳食建议。”[12]
塔利亚就是一个典型的例子。她住在以色列北部,是一位64岁的退休儿科护士,在临床上属于肥胖体格,患上糖尿病的可能性很高。她越来越担心自己的健康问题,并对我说:“我胖了很多,血糖水平很高。”但是她吃得似乎健康,早餐吃鸡蛋饼,一天中还吃大量新鲜水果和蔬菜,膳食很均衡。她在自己的后院种植农产品,特别喜欢苹果和油桃。她说:“这是我能筹备的最好的餐食了。我都不知道哪一点做错了。”
她连上了一个葡萄糖传感器,开始测量对餐食的常规反应。结果让她目瞪口呆:吃油桃、甜瓜和西红柿时,她的血糖指数飙升,喝1%脂肪含量的牛奶也会让指数大增;但是吃西瓜、喝3%脂肪含量的牛奶时,血糖反应却极其稳定。“这真的太令人吃惊了,”她说,“我根本不知道发生了什么。”
塔利亚根据个性化的指导建议改变了饮食结构,最终减掉17公斤的体重,血糖水平降低了20%。她说:“没有谁是和别人完全一样的,人们有不同的DNA,不同的个体特征。比如说我丈夫,他是个很瘦的男人,以前我们吃同样的东西,可他的血糖一直很正常。现在我改变饮食结构之后,血糖指数也降到了正常水平。谁能想到吃油桃会有问题呢?”
但西格尔的研究还没结束。研究人员随后将所有数据纳入一个能预测血糖反应的算法,其原理类似于亚马逊这样的在线零售商预测购物者的消费喜好。为了测试这个算法,他们又招募了100名新人,根据血液检测结果、年龄、微生物群等个体特征进行分类测量,并把数据导入算法中。这是对该项研究的重大考验:这个算法能比标准的碳水化合物计量法更准确地预测人们对不同食物的反应吗?
西格尔认为肯定可以。“想到我们可以准确预测任何一个人的对任何餐食的独特的葡萄糖反应,且无论此人是否参加实验研究,就让我们非常兴奋,”西格尔说,“这让我们确保了算法的扎实根基。”
最后,他们招募了26名处于糖尿病前期的新参与者,用算法针对每个人分别预测了能产生低血糖反应和高血糖反应的食物,并设计出两种饮食方式——“良好饮食”和“不良饮食”。
现在,相信你听到某些人的“坏”饮食却是另一些人的“好”饮食时,就不会感到惊讶了。正如预测的那样,不良饮食会引起测试者血糖水平异常增高和糖代谢受损,而良好饮食可以在提供相同热量的情况下,让血糖水平维持正常,让他们整个星期都没有出现一次大幅度上升。西格尔表示:“这些结果让我们非常震惊,这证明了你完全可以控制自己的血糖水平,处于糖尿病前期的人也可以通过食物的选择在一周内将血糖水平恢复到正常状态。”
毫无疑问,这些结果对营养学有重要意义,但我在本书中举这个例子是为了进一步加深对多样性的理解。在20世纪50年代早期,人们假设飞行员的身材都符合某个一般尺寸,结果导致了一系列的事故,同样的观念性漏洞也一直存在于营养学中,并且几乎从来没有被注意到过。如果不考虑到个体的多样性,那么在设计某种系统或指导方针时,就会产生局限或缺陷,甚至引发二者兼而有之的重大问题。
对营养学界而言,制订个性化的营养方案可谓任重道远,专家们需要做更多研究,理解微生物群和其他相关事物,用长期追踪的方式来直接评测人们的健康结果,而不是通过诸如血糖等间接指标。不过,这个开端已经给了我们很多希望,也给了研究人员理解该领域中总是存在的矛盾性实验结果的机会,因为它道出一个重要事实:科学本身也会让我们忘记多样性的存在。
2010年春天,经济学家迈克尔·霍斯曼开始了一个研究项目,想要弄清楚为什么有些呼叫中心员工的表现会比其他员工好。他做了很多研究,却始终找不到答案,似乎在这件事情上没什么可用于计量的逻辑基础。他告诉我:
我在一家公司担任首席分析官,该公司销售的软件可以帮助雇主招聘和决定是否留用员工。我们有5万人的数据,每个人都接受了45分钟的在线工作评估,随后被录用。我们研究了评测项目的每一方面,试图找出有关工作持久性和工作表现的线索,但是什么关联性也没找到。
最开始霍斯曼的团队预计,那些经常跳槽的人平均而言会离职较快。但事实并非如此,有些员工在过去几年有过五份工作,也有些只有一份工作,但这和他们的离职快慢并无关联。团队还认为,某些性格特征会与工作表现有关,但最后也并没有找到关联性。
后来霍斯曼的一位研究助理灵机一动,想到他们掌握着申请人在填写表格时使用的浏览器数据——有些人使用苹果公司开发的Safari浏览器,有些人用火狐浏览器,有些人用IE浏览器,还有些人用谷歌浏览器。能否通过对网络浏览器的不同选择来预测一个人的工作表现?霍斯曼觉得这听上去不太可能,毕竟浏览器的选择只是个人喜好问题而已。
然而结果令人吃惊。相对于使用Safari浏览器或IE浏览器的人,在火狐浏览器或谷歌浏览器上填写评估表的人工作持久性高了15%。他们随后研究了缺勤状况,并且再次发现了类似的差异:使用火狐浏览器或谷歌浏览器的人,比使用IE浏览器或Safari浏览器的人缺勤次数少了19%。
如果这还不够令人惊讶的话,那么与工作绩效相关的数据更加惊人了。那些使用火狐浏览器和谷歌浏览器的人生产力、销售额都更高,与客户对话更愉快,通话时间也更短。
霍斯曼说:“这是我们发现的最有说服力的调查结果。它不仅显示出了巨大的差异性,且数据表现很稳定。”可这是怎么回事呢?霍斯曼解释道:
我们花了不少工夫才弄明白。这其中的关键点是IE浏览器和Safari是预先安装的,PC机的附带浏览器是IE浏览器,苹果Mac附带Safari,这是默认装置。你要用浏览器的时候,只要打开电脑就行。但是谷歌浏览器和火狐浏览器不同,这些软件是要自主安装的,你必须足够好奇,才会去测试一下它们用起来是不是更趁手。然后你才会考虑要不要下载和安装它们。
员工所表现出的这种差异,和选择什么软件并没有关系,而是和选择背后的心理有关。有些人倾向于接受现实世界,并维持现状不做改变;有些人则认为世界应该是多变的,想知道有没有更好的做事方法,如果有的话就会采取相应行动。选择哪种浏览器本是一个看似无关紧要的决定,但背后却隐藏着心理学图谱上截然不同的立场,转化到他们正在做的工作中,就能反映出很多问题。
霍斯曼的研究对象,都是在零售行业或酒店行业的呼叫中心工作的专业人员。这些人通常都有文案脚本,用于回应消费者的问题。大多数时候他们可以照本宣科,这很容易,就像是一个默认设置。但每个人都会偶尔遇到一些销售文案覆盖不到的状况,这时候是坚持原来的做法不变,还是寻找一个新方式、想办法卖出一个新理念或取悦客户呢?
在呼叫中心,那些能够跳出常规的工作人员显然表现更好。当遇到困难时,他们总能想出一些创造性的解决方法。这种心理状态也能解释为什么火狐浏览器和谷歌浏览器的用户工作持久性更好,缺勤率更低。有能力跳出既定销售话术的员工更能在解决问题中发挥主观能动性,对自己的工作做出积极改变,从而让自己更开心、更高效。而那些认为现状不可改变的人,就容易被问题难倒。他们只是容忍着默认设置,直到无法继续下去。霍斯曼说:“最初,我们对结果的差异之大感到震惊,但后来就意识到,如何选择网络浏览器反映出了一个非常关键的特质——质疑默认状态的能力。在当下这种高速变化的时代,这一点极其重要。”[13]
霍斯曼的实验无疑可以作为智力敏捷度的佐证。这些人具有局外人的心态,能够跳出既有范式,这让他们更高效,也更有成就感。他们会主动解决问题,而不是单纯忍受麻烦。
这个案例中还隐含着另一个意义,也与本章节的内容有关。在商业领域有一个人们非常熟悉的理念——“最佳实践”,它的实施基于一个简单的断言:如果有一种方法被证明是优越的,那么每个人都应该使用它。例如在医疗行业,医生常常用不同的方式为病人做手术,这会使病人得不到最好的治疗,在这种情况下最佳实践往往至关重要。最佳实践不是绝对意义上的“最佳”,而是相对的,是迄今为止最好的。如果有人能够找到一种超越它的替代方式,那么最佳实践就该被修正。最佳实践应该是与时俱进的,其更新迭代应该以合理的、数据驱动的方式进行。
但现在我们应该明白,最佳实践尽管有用,却是不完整的。为什么?让我们回到伊兰·西格尔的研究来探讨这一缺陷。假设你根据人群的血糖反应来对食物进行排序,你可以严谨地执行,并确定某一种饮食方案为最优。但实际上,这未必是最理想的饮食方案,至多也就是最理想的标准化饮食方案。
现在想想呼叫中心的员工。很多公司都会测试不同的话术脚本、比较客户反馈结果、进行数据统计测试,最终得到一个关于哪种话术最优的看似科学的结论。但这就忽略了灵活性的好处。霍斯曼的实验表明,员工如果能够明智地偏离剧本,就会像刚才说过的那样做出更优异的业绩。不仅如此,这还能让他们发挥长处,真正把个性特质融入对话之中。所谓的剧本是应该因人而异的。或者换句话说,最佳实践不能通过比较标准化的解决方案建立起来,还必须比较不同的灵活性方案。根据我们对多样性的了解,无论是驾驶舱、饮食、话术脚本还是其他东西,灵活的体系往往更有优势。
如何为工作注入更强的灵活性是一个重要话题。比如,如果允许员工根据个人情况来调整工作安排,那么不仅工作的回报率会更高,企业也能获得很多新人才(比如那些不喜欢固定工作时间的人)。这对于年轻一代来说尤其如此。一项研究表明,工作与生活的平衡是年轻人选择雇主时考虑的最重要因素。
然而这只是灵活性可以带来的一个优势,还停留在企业或社会性组织运作的表层,更深层次的意义还埋藏在多样性科学之中。多样性能让员工发挥自己的优势,将自己的独特之处带到工作中去。
当然,灵活性也会带来危险。拥有做出改变的足够自由,也意味着有了更多犯错的可能,这当中总是存在一个平衡。然而,我们如果过度重视控制和防止犯错,那就会无视灵活性丧失的潜在危险。简言之,我们需要更加科学地看待多样性。
标准化已经融入了我们的生活。20世纪早期的教育改革者为学校设计了标准化的课程、标准化的教科书、标准化的成绩单、标准化的假期和标准化的文凭。[14]这种做法依据的是如下逻辑:不应该让教育配合个体学习者的需要,而应该把个体塞入标准化的培养模具中。
这种模式类似于大规模生产:学校就像工厂生产小部件那样批量出产学生,以同样的方式和速度,用同样的工具和课本,并通过同样的测试来衡量结果。就像教育学家埃尔伍德·库伯利所说:“我们的学校在某种意义上就是工厂,原材料(儿童)被塑造成满足各种需求的产品。”[15]
这种方式确实比上一代那种杂乱无章的教育体系更有优势,但也存在局限性。毕竟年轻人在很多重要的方面各有差异,学校应该为各年级的学生设计出灵活的课程,这一点聪明的老师都知道。
事实上,有非常权威的证据证明灵活的课程设置能让学校和学生都受益。2015国际学生评估项目表显示,“适应性教学”是促成高水平教育结果产生的重要因素之一,其影响力超过学科设置和学生人数。适应性教学能带来你期望的所有东西,比如适应学生个性化需要的老师。在这种教学模式下,老师不会再让每个人在同一时间按同一速度做同一件事。
芬兰的教育体系被认为是世界上最好的。玛丽亚·穆里是一位优秀教师,她在一篇文章中总结了芬兰教育的主要原则,其中有很多要素与本书的内容相吻合,比如横向技能(旨在让儿童具备灵活的思维能力)、跨学科学习(让学生明白学科之间没有围墙,应该将不同学科关联起来,从而建立新的认知和见地,这也是我们在前面章节中提到的重组式创新)。[16]穆里还阐释了为什么教育系统本身也应该具有灵活性:
学生都是独立的个体,我们不能用同样的方式教育他们。芬兰的学校会为同一个班级的同学设置至少5个不同层级的作业标准,这就意味着每个学生都有自己明确的目标。这叫作差异化。
另一个关键因素是评估学生的多样性。她写道:
芬兰的新课程体系强调评估方法和评估角度的多样性,目的是更好地指导教学。每一个学生的学习进展信息必须被及时充分地告知学生本人和家长。我们设定目标,讨论学习过程,并总是基于学生的优势特长来进行评估。
穆里还非常前瞻性地提到,如果学习小组具有足够的认知多样性,学生将可以受益:
我们强调要让来自不同背景的学生在一起学习。我相信和不同的人共事,互相之间总能学到新东西。
不少人认为在有的教育系统中个性化已经走得太远,而哈佛大学的学者托德·罗斯等人则说个性化目前还不够。这是一个很好的辩题,但最终要让证据说话。目前全球教育界的普遍观点是,提供多样化教学而不是坚守刻板的固有体系,对学生的健康成长更有益处。
当然,取平均数这种简单粗暴的做法不只存在于教育领域,还广泛地渗透到了科学领域,一个典型的谬论是将男性样本的平均数套用于女性。想想驾驶舱的例子,如果这个设计对于不同身材的男性而言已经是噩梦,就更不用说对于体型相对娇小的女飞行员。卡罗琳·克里亚多·佩雷斯在其著作《看不见的女人》中提到,钢琴键是根据所谓“普通男性”的手部尺寸设计的,警察防弹衣、军事装备等物品也是如此。[17]
物品设计上的缺陷只是一个缩影,折射出的是广泛存在的、服务于男性的制度设计,这无形中让女性的处境更加艰难。佩雷斯这样分析这一现象:“最需要说明的一点是,它往往不是出于恶意,甚至都不是故意为之。它产生于一种延续千年的思维定式,实质上就是根本没有人朝这个方向思考过。”
这种理念上的混乱也会发生在所谓的“硬”科学上。几年前,加州大学圣巴巴拉分校的神经学家迈克尔·米勒对16个人进行了一项实验:先为受试者连接上功能性磁共振成像装置,然后给他们看一张单词表,休息一会儿再继续看另一张单词表,接着给受试者们看一组单词,并让他们每看到一个在单词表上的词就按下按钮。[18]最后,研究人员对受试者的大脑扫描结果进行分析,目的是确定与语言记忆有关的神经回路。任何读过神经科学论文的人对于这种大脑地图都不会陌生,也就是大脑的哪一个部分会亮起。但这项实验的一个短板是,大脑地图是基于受试者的平均反应测得。
出于某种原因,米勒打算先不看平均反应,而是详细去看每一个体的单独反应。他在接受托德·罗斯的采访时说:“这太令人吃惊了,大部分人看起来根本不像普通地图……最令人震惊的是,人与人在地图样式上存在非常大的差异,而不是略微不同。”[19]
试想,神经科学已经算是现代科学研究中十分严谨的领域,尚且存在误导性的结论。平均化的脑图实质上掩盖了个体的差异性,对此托德·罗斯评论道:“米勒在人脑实验中所发现的巨大差异不仅局限在语言记忆方面,面部感知、内心表象、程序性学习、情绪情感等方面其实都存在这一问题。”
但这绝不代表神经科学有缺陷和漏洞。其实有时使用平均数是有意义的,只不过也有很多时候,科学家把使用平均数作为一种下意识的习惯,而这基本上就等于把人看作克隆人而不是鲜活的个体。
*
我最喜欢的一个关于多样性的科学实验,是由英国埃克塞特大学的心理学家克雷格·奈特完成的。他在成为学者之前曾是一名销售员,在全国各地跑。有一次他出差到一个大公司,眼前是一排排一模一样的树脂办公桌一直延伸到老远的地方,他被办公室的标准化格局震惊了。当时流行的观念是,工人应该在标准化的办公空间工作,这让奈特感到无比压抑。他告诉我:
这被称为“精益办公理念”,曾在2000年前后风靡一时。当时的想法是员工不应该在办公场所放置私人物品、照片、装饰画或植物,这类东西被认为会造成干扰。如果有科学证明某一特定类型的办公布置是最有效的,那么管理者就认为每一个人都要采用这种方式。[20]
作为一名到处出差的销售员,奈特注意到很多地方的办公室都遵循着所谓的精益理念,经理们自豪地看着一排排标准化的办公桌,而员工们则在这种整齐划一的环境中埋头苦干。管理者认为找到了一种经过实证检验、有助于提高效率的方法。但有心理学背景的奈特感到很难认同:
我的预感是这会带来意想不到的后果。如果你把一只大猩猩或一头狮子放在这种场所中,结果会非常悲惨,它们会感到压迫、想打架,甚至过早死亡。我认为人类对于这种标准化的空间更难适应。人有自己的气质、性格、兴趣和思想,会更想为自己创造独特的空间。
几年后奈特进入学术界,获得了检验假设的机会。他和研究员亚历克斯·哈斯兰一起设计了一项精妙的实验。
他们找来两组受试者,给他们布置了上班族的典型任务——检查文件、处理信息、做出判断等。[21]第一组人被置于所谓的精益环境中,办公室内布置统一化,且空间大小仅勉强够用,这几乎就跟奈特出差时看到的状况一模一样。第二组人也被安排在标准化的工作场所,但有所差别:墙上挂上了装饰画,桌子旁摆放了一些植物,奈特称之为“点缀型环境”。
结果如何?第二组人的业绩提高了15%。其实这样的结果并不让人意外。即使同在标准化空间里工作,办公环境更为人性化的人也会表现更好。奈特说:“这证实了我多年来的猜测,大部分人都喜欢经过点缀的工作空间,他们说那些装饰画和植物会让环境更舒心。精益化的环境也许可以用在流水装配线上,但对于需要认知力或者创意的工作则不太适用。”
接着,奈特又找来第三组人,并再次改变了规则:这一组人被允许自主装点办公场所,选择自己喜欢的装饰画和植物,根据自己的口味、个性和喜好来布置空间。奈特说:“他们被告知可以把办公室当成自己的家,我把这组的工作空间称为‘个性化环境’。”
从外围视角来看,个性化环境里的很多布置方式看起来就和精益环境、点缀型环境并无二致,毕竟有些人本来就喜欢简约空间,而有些人喜欢华丽的装饰。但平均而言,个性化环境对受试者的有益影响超过另外两种。这就是关键所在:它是人们个性化选择的结果,而不是标准化的配置。就像有着可调节座椅和踏板的驾驶舱和伊兰·西格尔打造的定制饮食方案一样,这样的工作空间更匹配于某一特定员工的需求。
从最后的实验结果来看,在个性化环境里工作的这一组人,其生产能力获得了迅猛提升——比精益环境下的人高出近30%,比点缀型环境下的人高出15%。可以说个性化对工作效率的提升有着非常显著的效果。奈特指出:“一旦有了创造自己空间的自主权,人们所创造出来的东西就会是无与伦比的。有一位参与者说:‘这真是太棒了,我真的很喜欢。我什么时候可以搬进来?’”
生产力之所以得到提升,是因为人们有了自主权,有权选择而不是被指定在某种环境里工作,这让他们感到被赋予权力,因此也更有工作动力。人们可以根据自己的喜好和个性来设计自己的空间,这听起来可能是个小事,但实际上影响深远,因为它真正地考虑到了多样性的作用。
伊兰·西格尔跟合作研究者们用自己的开创性研究成果创办了一家高科技公司。目前这家公司只在少数几个国家开展业务,但他们的目标是把这一做法带到全球。其实个性化检测的流程很简单,只需要提供粪便样本和血液检测结果,就能检测出你的微生物群情况和血糖水平。然后,把这些检测结果导入算法中,研究人员就能提供个性化的饮食推荐方案和一个数据库,其中包含10万份食物和饮料的葡萄糖预测值。尽管不如2015年执行的实验那么系统化——当时西格尔针对每一顿餐食都测量了微生物群状况和血糖反应,但这仍然标志着一种研究的方向。饮食学,就像人类科学的其他分支一样,正从标准化迈向个性化。
分子医学教授埃里克·托波尔是当今医学界的权威之一,他对西格尔的研究很感兴趣,于是自愿接受全面测试,追踪每一顿饭和每一杯饮料摄入所带来的血糖反应,同时对肠道微生物群进行测试。在几周时间里,他就对自己的身体在摄入不同食物后的各种反应有了深入了解,这是之前无论阅读多少标准化饮食指南都无法企及的。他不仅发现自己有一种不寻常的微生物群,还发现自己多年来一直在吃的食物会导致惊人的血糖峰值。托波尔在《纽约时报》上写道:“我的肠道微生物群中有一种特殊的类杆菌——粪便拟杆菌,占比达到27%(而普通人的占比平均不到2%)。我的血糖峰值高达每分升①血液160毫克(正常空腹血糖水平为不到100毫克)……”
这些发现不仅有利于他的健康和寿命,还使他清楚地看到了很多饮食指南中的矛盾点。“看了几十年的饮食指南和政府发布的所谓食物金字塔,我们对营养学还是知之甚少。事实上,很多信息一直在相互矛盾。默认有一种适合所有人的最佳饮食方案,这是很多饮食指南的大前提,现在这一前提的核心缺陷正变得越来越清晰。”
2019年4月,西格尔公司的科学家在伦敦会见了英国国家卫生部门的高级官员。之后,为了获取更多的数据信息,该公司的研究不仅会在西格尔的实验室开展,也会拓展到其他地方。[22]他们不仅要研究微生物群和基因组并提出饮食建议,还关注药物、睡眠和压力等其他个性化因素。托波尔写道:
我们真正要做的是从多项研究中提取多种类型的数据。凭借先进的算法,这显然是可行的。在未来几年,你可以有一个虚拟健康教练,他深度了解你的各种健康指标,并能够为你提供个性化的饮食建议。
然而,饮食科学只是这场概念性革命的一个缩影。从标准化向个性化的转变几乎会出现在我们生活的方方面面。如果运用得当,人类将能够凭借这种力量来改善健康、提升幸福感和促进生产力。正如西格尔所说:“多样性是人类的必然特征之一,是时候好好思考这个问题了。”
①编者注:1分升等于0.1升。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。