现在,让我们来思考一下戈登列出的“健康”和“医药”两个条目,这是因第二次工业革命而焕然一新,但第三次工业革命却远未触及的人类生活的两个侧面。专攻个人基因组学与生物技术的公司23and Me将DNA(脱氧核糖核酸)测序技术运用到了顾客的唾液检测上,以让他们洞悉自己患上某些疾病的可能性以及关于他们祖先的点点滴滴。23and Me的价值主要体现在对基因信息的收集积累上。截至2017年4月,23and Me已经拥有了约200万顾客的基因信息。数字版本的信息集成库可以运用强大的分析工具对数据进行解析。23and Me将从别处获取的DNA上的发现呈现在顾客面前,但同时,它运用自身数据库进行自主研发的能力也在不断提高。在23and Me的网站上,作为其研究发现公之于众的成果就包括迄今为止仍然未知的,能造成甲状腺功能减退症与帕金森病的遗传诱因。随着顾客人数的增长与工具分析能力的增强,该公司网站有望让人们了解疾病,这是其他手段难以实现的。这些新知识成了将其他数字技术用于人类遗传物质的修改方面不可或缺的指路明灯。如果我们认为23and Me的疾病易感性数据库不过是用于宣扬疗效更佳的药物广告的工具,那我们就可能完全错怪这家公司了。23and Me所做的绝不仅是向因遗传因素易感哮喘的人群推销治疗该疾病的药物而已。
为了看到机器学习在改善人类健康状态方面的潜力所在,让我们探讨一下机器学习专家佩特罗·多明戈斯(Pedro Domingos)在关于机器学习如何攻克癌症难题方面的构想。多明戈斯将机器学习的目标定为探索终极算法,所谓的“终极算法”是指“原则上来说,可用于从任意领域的数据中发现知识的通用(机器)学习者”。机器学习不断寻求构建人类用于学习的各类策略,但“机器学习者”并不满足于单纯地复制人类学习者的表现。多明戈斯等机器学习专家致力研发的机器学习者将能够发现在没有机器加持的前提下人类智力无力洞悉的模式。多明戈斯承认,人类目前还没有掌握这种终极算法,但他断言,我们正朝着那个方向不断前进。
癌症是极难攻克的疾病。人类与癌症的抗争史就是一段虽有雄心壮志却屡屡遭遇滑铁卢的故事。回顾令人沮丧的过往,对这类疾病的复杂性的深入了解让对癌症了如指掌的专家产生了一种听之任之的宿命感。在悉达多·慕克吉(Siddhartha Mukherjee)为癌症“立传”的获奖著作《众病之王》(The Emperor of All Maladies)一书中,他描绘了人类试图攻克癌症的梦想屡屡破灭的辛酸史,并从中得出以下结论:“癌症是我们生长过程中存在的一处缺陷,这处缺陷深深根植于我们自身。因此,只有当我们能够彻底脱离由成长引发的一系列生理进程——衰老、再生、愈合与繁殖时,我们才能摆脱癌症。”
慕克吉听天由命的论调未免太操之过急了。或许人类的失意史告诉我们的并不是癌症客观上的不可治愈性,而是人类智力与想象力的局限性。人类凭借直觉走了很长时间的弯路后才假想并论证了吸烟与肺癌之间存在的联系。癌症或许是我们无力靠自己解决的问题,但在有了某些数字技术的辅助后,我们便可能攻克它。多明戈斯将他针对癌症研发的机器学习方案称为“抗癌X计划”(CanceRx)。该计划将机器学习技术运用到我们正起步收集的海量数据中,以探究其中存在的既定模式。在这些数据面前,人类肿瘤学家也望而却步,只能通过简化的手段来处理分析。但数据一旦被简化,专家可能就只能发现其中最明显的模式。除了目前最明确的观测结果(吸烟者更易患肺癌,日晒时间过长的人更易患皮肤癌)之外,对于人类研究者而言,想要对其他模式一窥究竟是极其困难的。以上观测结果都属于大型统计效果。然而,想一探癌症全貌就需要对影响小于吸烟或过度日晒的各类因素有全面了解。
“抗癌X计划”将“分子生物学知识与取自DNA测序仪、微阵列基因芯片及许多其他来源的海量数据融合在一起”。在此基础上,我们还可以添加关于生活方式的信息,包括癌症患者、非癌症患者及对癌症治疗有不同反应的人群的饮食、职业以及体力活动的水平与方式。“抗癌X计划”从海量数据中寻找超出人类智力与想象力的模式。每当有新的数据点汇入时,“抗癌X计划”攻克癌症的胜算就增添了几分。多明戈斯说:“这个模型处在不间断的演化过程中,不断将新的实验结果、数据源与患者病历纳入其中。最终,它便能通晓每一种人类细胞——人类分子生物学中研究的所有细胞的所有通路、调控机制与化学反应。”“抗癌X计划”最多可以被视为一种技术思维实验。这一计划的实现对于多明戈斯而言,依然遥遥无期。他是将“抗癌X计划”作为一种猜想提出的,一种关于机器学习的发展将引领我们去往何方的猜想。(www.xing528.com)
你不能妄想着有一天,心心念念的“癌症克星”能横空出世——只要吞下这颗神奇的药丸,当下百般摧残你的癌症便立即被治愈了,并且日后你也不会再度罹患癌症。我们可以明确地说,世上不会有这样的药丸。正如16世纪西班牙人探索中南美大陆时,就有清醒者质疑过西班牙征服者发现了“青春之泉”一事的真实性。慕克吉将癌症视为人类生长过程中的缺陷,认为癌症根植于基本生物性的论调恰好说明了个中原委。任何一种从受精卵开始发育的生物在从单一细胞分裂生成数万亿细胞的过程中都难免会出现一些致命的差错。癌症之邪恶在于其可突变性,它会针对治疗措施片刻不停地进行相应的演化。如果一种靶向药物命中了癌症赖以维系的某种机制,那么,它就会更换别的路径来实现生长的目的。“抗癌X计划”则利用终极算法的超级智慧来对抗癌症,它从关于人类癌症的总数据库中找到规律模式。假如癌症发生了新型突变,“抗癌X计划”将运用它惊人的学习能力迅速找到破解之法。多明戈斯说:“因为每种癌症各有不同,我们需要利用机器学习找到普遍的范式;因为每个组织都能产生数十亿个数据点,我们需要利用机器学习计算出每个新患者下一步的治疗方案。”
在本书撰写之际,“抗癌X计划”还只停留在技术构想的阶段。与其他令人神往的未来图景一样,这一计划最终究竟能否实现,我们不得而知。当多明戈斯在描绘“终极算法”时,他切换到了营销模式,称其为“划时代的最伟大科学成就之一”,随即又说:“实际上,终极算法是我们最无必要去发明的东西,因为一旦我们放任它发展,它就可以创造出能够被创造出来的一切。我们需要做的只是给它提供足量的对口数据,让它去发现相应的知识。”重点是我们要理解,终极算法并不是一个非此即彼的绝对命题。我们翘首以盼的收益即便没有多明戈斯描绘的那样惊人,也将是十分巨大的。或许,“抗癌X计划”并不能治愈所有的癌症,但即使这个目标只有部分实现,也仍然值得我们欢呼雀跃。
人类将机器学习应用于疾病防治领域的能力及对该应用的渴望都是有迹可循的。2016年9月,马克·扎克伯格(Mark Zuckerberg)和他的妻子普莉希拉·陈(Priscilla Chan)宣布将在未来10年内投资30亿美元以支持多明戈斯的理念。扎克伯格与陈孜孜以求的新技术不仅要能治愈癌症,而且要治愈所有的疾病。在他们的注资宣言中,扎克伯格问道,“在本世纪末,我们能够预防、治疗并控制所有的疾病吗?”这一举措将打造出一个生物学中心,让科学家与工程师齐聚一堂,共同研发预防、治疗或治愈疾病的新型工具。这一举措的第二要务是在数字革命的背景下研发可能成为现实的革命性新型医疗技术。扎克伯格与陈提出人工智能带来的进步能够使新型脑部影像技术在神经系统疾病领域得到有效应用,机器学习可以应用于癌症遗传学,以及芯片技术能够发展到迅速锁定疾病的程度。
如果人工智能可以成功地治疗并预防疾病,那将是极其振奋人心的。但人工智能对人类文明产生的影响则源于其在人类奋斗领域的广泛的适用性。托马斯·纽科门(Thomas Newcomen)最初构想的蒸汽机是用于抽取矿井积水的,但很快,它就被广泛应用,并不只限于承担被水淹没的矿井中的排水任务。就在转瞬之间,工厂、火车、远洋船只通通都装配上了蒸汽机。人工智能也同样无所不能。这不仅是一项可以应用于汽车驾驶或癌症治疗方面的技术,只要自然界中存在可供人类了解但似乎超出人类智力与想象力范围的模式,此模式就应该随时随地体现其价值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。