首页 理论教育 人工智能与多学科融合:跨界合作掀新浪潮

人工智能与多学科融合:跨界合作掀新浪潮

时间:2023-06-21 理论教育 版权反馈
【摘要】:何积丰中国科学院院士,中国科学院人工智能创新研究院学术委员会委员中国科学院院士,著名计算机软件科学家。自2005年11月起,连续当选为澳大利亚计算机学会澳大利亚人工智能理事会理事长。2019年8月被任命为2024年国际人工智能联合会大会主席。第二个问题,就是机器学习以前,过去很多的人工智能成果主要体现为专家系统,这是基于因果推断的人工智能。

人工智能与多学科融合:跨界合作掀新浪潮

陈 杰

中国工程院院士,IEEE/IFAC会士,同济大学校长

“复杂系统智能控制与决策”国家重点实验室主任、中国自动化学会副理事长、中国人工智能学会副理事长。主要研究方向为动态环境下复杂系统的多指标优化与智能控制、多智能体协同控制等。近年来,以第一完成人获国家自然科学二等奖1项、国家科技进步二等奖2项、省部级一等奖4项以及何梁何利基金“科学与技术进步奖”。发表SCI收录论文100余篇,以第一发明人获授权发明专利40多项,出版学术专著4部,教材和译著各1部。

何积丰

中国科学院院士,中国科学院人工智能创新研究院学术委员会委员

中国科学院院士,著名计算机软件科学家。现任中国科学院人工智能创新研究院学术委员会委员、上海市人工智能战略咨询专家委员会委员、上海市人工智能产业安全专家咨询委员会主任、华东师范大学终身教授、华东师范大学软件学院创院院长、上海工业控制系统安全创新功能型平台(上海工业控制安全创新科技有限公司)首席科学家。长期从事计算机软件理论及应用研究,针对软件的复杂性、正确性和可靠性等问题开展了系统性的研究。他是程序统一理论创立者、数据精化完备理论奠基者、可信软件设计理论与技术开拓者,其研究成果是保障人工智能应用安全可信的关键手段,是安全可信人工智能领域的领军人物。开创性提出的可信人工智能原则,得到G20全球领袖吸纳认可,为推进安全可信人工智能产业发展做出奠基性贡献。

张成

悉尼科技大学副校长

2017年2月27日被悉尼科技大学聘为杰出教授,2017年12月1日被任命为悉尼科技大学副校长(中国科研合作)。自2005年11月起,连续当选为澳大利亚计算机学会澳大利亚人工智能理事会理事长。2019年8月被任命为2024年国际人工智能联合会大会主席。1982年3月在复旦大学获得学士学位,1985年3月在吉林大学获得硕士学位,1991年10月在澳大利亚昆士兰大学获得博士学位,2002年10月在迪肯大学(Deakin University)获得科学博士学位(高级博士学位)。重点研究领域是数据挖掘及其应用。发表300余篇科技论文,其中包括在国际权威期刊上发表的诸多论文。澳大利亚计算机学会会士(ACS Fellow)和IEEE计算机学会高级会员。还担任世界三大学术顶会的主席、程序委员会主席或组织主席,包括ICDM—2010、KDD—2015及IJCAI—2024。

梅 宏

中国科学院院士,上海交通大学人工智能研究院院长

中国科学院院士,发展中国家科学院院士,欧洲科学院外籍院士,电气电子工程师协会会士(IEEE Fellow)。主要从事软件工程和系统软件领域的研究,在构件化软件中间件、开发方法学和工具环境等方面取得了系列成果。发表学术论文150余篇,多次获国际会议最佳论文与优秀论文荣誉。获国家技术发明专利授权10余项。承担了数十项国家级科研项目,2次担任国家973计划项目首席科学家。曾获国家技术发明一等奖和二等奖、国家自然科学二等奖、国家科技进步二等奖等科技成果奖励。历任国家863计划专家组成员、组长,国家“核高基”科技重大专项专家组成员,全国信息技术标准化技术委员会大数据标准工作组组长,国家重点科技研发专项“云计算与大数据”实施方案编制组组长、总体组组长,国家“科技创新2030—重大项目”大数据重大项目立项建议和实施方案编制组组长。

陈杰:人工智能下一步的基础创新,可以从不同学科中吸取非常重要的养分,比如数学脑科学、物理学,甚至哲学心理学等人文科学。这些学科为人工智能未来的发展能够带来哪些新方向?

何积丰:我提出复杂思维组合性研究。当前人工智能的深度学习模型,主要是基于深度神经网络,它继承了我们人类思维信号的传递特性,依赖于训练数据和应用场景。这方面各行业都有自己的经验,它们证明基于数据的机器学习能够给我们带来新的知识、新的认识问题的规律,这是我们已经看到的。

下面我们来谈谈我们遇到什么样的问题。回顾早期艾伦·图灵(Alan Turing)提出智能问题的时候,他的问题是问“机器能够思考吗?(Can machine think?)”。而我们现在提的都是机器的学习问题。我认为学习和思考还是有距离的。我们从小学开始,老师给学生灌输知识,这是一个学习过程。但是我们很希望能够举一反三,能够慢慢分析问题、找到问题,这就不属于纯粹学习了。我们觉得应该朝前走一步,这也是为什么我们考虑新的研究领域。

第二个问题,就是机器学习以前,过去很多的人工智能成果主要体现为专家系统,这是基于因果推断的人工智能。分析这种人工智能,我们现在有这样的结论,也就是2011年图灵奖获得者茹代安·珀尔(Judea Pearl)说的:“以数据为中心的机器学习所得到的知识经验解释性弱,并且会出现与原本知识完全相反的情况。”茹代安先生举过这样一个例子:过去有数据分析显示人参加锻炼跟我们胆固醇之间存在的关系是,锻炼越多胆固醇越高。这当然不是我们希望得到的结果,我们希望锻炼能使胆固醇降下来。后来发现导致这个结果的主要原因是在机器学习里面少了一个特征值,没有把人的年龄考虑在里面。如果把年龄这个因子考虑进去,就会发现不同年龄段的人锻炼之后都有好的成果。这就是机器学习的短板。

1975年美国一位哲学家杰瑞·福多(Jerry Fodor)提出,思维是可以使用具有语法规则的语言来形式化表征的[1]。这个判断我认为并不令人惊奇,人们之间交换思想就是靠语言的,那至少证明语言里具有表达思想的功能。问题在于是不是只有形式化的语言能够表达这样的思维?为什么强调形式化?因为只有形式化语言机器才能消化,否则机器是听不懂的。

假设真的有形式化的语言,我们可以推导出这样一个思维模型,思维的活动是需要向前推进的,这就意味着在人工智能原始创新上,既有基于逻辑的图灵机,也有基于数据和传递的神经网络。换句话说,大脑和神经系统两者都是需要的,不单单是传递信息的问题。

下面我们回到复杂思维组合性本身。先举一个简单的例子。关于牛顿发现三大定律,人们一直传说,他坐在苹果树下,苹果掉在他头上了,这就是很片面的数据知识。经过加工和消化以后,才形成最后一个定理,即加速度是跟哪些因素有关的。换句话说,我们要对碎片化知识信息进行加工再消化,才能在我们的大脑里面形成可组合的思维。从这个例子中,我们得到以下结论:思维是加工和消化知识并产生新知识的过程。因此,对复杂思维组合性的深入理解和研究,是突破现阶段基于数据的人工智能算法和模型的关键。我们不是说任何事情都要靠数据。除了数据之外,我们大脑也是很重要的源泉。

我们现阶段主要在做如下4个研究:

第一步,我们要关注面向思维的知识表达。知识是总结提炼思维的要素,而目前已有的知识表达方式,不足以体现思维的过程,体现思维过程的思维表达是我们应该研究的第一个问题,这样我们就可以把思维和知识连在一起,这是第一步。

第二步,我们应该构建知识和思维相互作用的模型。我们知道,有意识的思维与知识的关系,相对其他意识更加具体。实际上在人的大脑里有很多不同类型的思维,比如说下意识、潜意识无意识。这里举一个非常简单的例子,运动员参加国际竞赛,教练往往鼓励他说:你是代表14亿人走到这个舞台上。这时候他的脑子下意识产生一个压力,我一定要把这次跳水跳好,这个结果有时候很成功,他发挥得非常好,有时候会起到负面作用,因为他的心理压力太大,没有把正常水平发挥出来。因此,我们觉得意识和知识之间是有相互作用的。

第三步,我们要讨论思维的组合性。思维不是一个简单思维。我们对猕猴做了强制性选择实验,看它在饥饿和口渴的时候选择什么,是喝饮料还是吃东西。事实证明它在不同场景下,大脑皮层产生的反应是不一样的,是依次活跃的。下面这张图演示了这个过程。第一种情况下,它很饥饿,它看到香蕉,做了一个动作,把左手的绳子拉动了,表明它很饿,想吃香蕉。第二种情况下,它很渴,旁边放了瓶水,右脚边有个踏板,它踩了踏板,表示它很渴。所以脑电波并不是在同一个地方发生的,这跟我们脑科学的研究关系非常密切。

最后,我们想研究新知识和新架构形成的机制。机器产生知识的过程是机器通过知识数据的训练产生知识,我们觉得可组合思维也是创造新知识的过程。下图的左边是一组在飞的鸟,实际上反映了复杂的多元性输入,它不是一只鸟,是很多只在一起的。这就需要了解鸟在飞行过程中,它们之间怎样的互动可以保证不会发生撞击事故,这里有很多产生新知识的机会。此外,我们从人的运动例子里可以看到,一个人骑着摩托车开得很快,他可能下意识会把腰弯下来、把头低下来,他觉得这种情况下阻力会比较小。还有在滑冰场上,运动员腰都弯得很低的,他认为这种动作阻力最小。所以我们觉得可组合思维是创造新知识的过程。

陈杰:人工智能不仅仅是一个算法,它其实希望机器和人一样能够工作,包括认知、分析、推理、决策、控制等。人工智能怎样与其他学科,包括计算机学科、控制学科等学科进行交叉融合,我们也希望能够展望一下未来愿景。

张成奇:回顾人工智能的历史,最早的时候人们追求的是通用智能GPS(general problem solver)。他们想通过计算机的能力来解决普遍的问题,最早的成果就是在初等数学的公式证明方面。但是后来遇到了瓶颈,出现了人工智能的寒冬。第二波人工智能主要是基于知识的智能,当时人们认为人工智能主要是模仿人的高级智能,所谓高级智能就是人和动物的不同。人和动物最大的不同是认知方面,基于知识的人工智能是以专家系统为代表的,确实解决了很多高级智能的问题。但是这也遇到了瓶颈,就是感知方面非常差,不管是识别还是翻译,甚至语音。这些智能不仅人类有,动物也有。实际这个智能不仅仅是模仿人的智能,也要模仿动物的智能。

最近火的第三波人工智能是基于数据的智能,它最成功是在感知方面,比如说图像识别自然语言理解、翻译等,所以现在的人工智能在应用方面做得非常好。现在自动驾驶很火,但为什么几年前自动驾驶没人研究?这是因为如果在感知方面做不了的话,就没有自动驾驶这一说。

人工智能发展60年来,基本分成三大学派。一个是认知学派,或者叫基于知识的学派,它主要用到符号推理可解释;一个是感知学派,或者叫基于数据的学派,这个学派现在很成功;另外一个是行为学派,主要是做机器人,它和控制的反馈有关。(www.xing528.com)

自动驾驶是一个非常典型的案例,是从感知到认知再到行为的一个非常好的融合。这个领域结合了计算机知识、数学知识,同时也用到了推理和控制的知识。在感知方面,自动驾驶汽车要快速准确识别周围环境,否则就无法自动驾驶。认知方面,要对地图有理解、对路径有规划、对环境有反应,做出行动的决策,这些都是由认知部分决定的。行为方面,就是对决策的执行,对汽车的实体控制、速度、方向。我觉得自动驾驶这个平台已经非常典型地把人工智能和其他领域的结合反映得淋漓尽致,而且把人工智能三大学派也结合到一起。通过这一个例子来说明人工智能:计算机是它的核心,如果没有计算机,那么就没有人工智能,因为计算机是人工智能最底层、最核心的或者说0到1的变化。其他学科也很重要,可能是从1到100的变化,或者1到1000的变化。当然数学对人工智能发展也起到核心的作用。

陈杰:人工智能深入各个行业中,对各个行业有很大的赋能作用。当前人工智能跟其他应用领域的融合发展趋势是什么?人工智能发展是否可以减少对行业知识的依赖?

梅宏:自从计算机被创造出来,从图灵的通用计算模型开始,我们就希望用计算机来替代人的脑力劳动。现在来看,做算术算不算智能?或者做简单的科学计算算不算智能?100年前,这绝对是高智能,因为很多人没有受过这种教育,不具备这样的能力。但是当计算机解决了一般的算术、科学计算的问题之后,基础的计算能力就不再是我们追求的智能了。随着社会的不断进步和发展,现在人们对计算机智能能力有了新的诉求。专家系统也是非常成功的知识工程的例子,早期它解决了很多实际的问题,但是到后期为什么不行呢?这是因为专家系统按照逻辑推理的模式,很难解决通用的问题。特别是常识,普通小孩子能处理的常识问题对于专家系统来说就非常困难。

目前人工智能形成新的浪潮,主要的突破还是在感知。为什么是深度神经网络呢?深度神经网络本身并不具备真正的识别能力,它是一个基于数据的分类器。深度神经网络、深度学习使得我们在感知上取得重大突破,现在感知智能已经在各个行业得到广泛应用。但凡是现实中的问题,只要我们能把它建模为一个分类问题,就可以用深度学习来解决它,各个行业应用主要在这个方面。就这个意义而言,我以为现在人工智能在各个行业的应用,就是信息技术或者计算技术在各个行业应用深化的新阶段。

人工智能和行业结合的含义是什么?在使用专家系统的情况下,首先需要人工把行业知识规则化,然后才能使用系统进行计算和判断。而现在的人工智能是基于数据的,它可以直接从数据里面,通过分类器去自我分类、识别、学习一些规则。目前的应用是处在这样的阶段。这就是我们经常讲的AI给各个行业赋能,使各个行业进入所谓的深度信息化。什么叫深度信息化?就是首先要完成数字化,也就是将各个行业所有的知识、流程数字化;然后是网络化,能联网地把它们连起来;第三个层面才是所谓的智能化,也就是呈现出智能的应用。

就目前而言,我认为人工智能必须和别的行业、知识相结合。当然,可能这种行业、知识的结合与过去不同,它可以大大减少人的介入程度或者人对规则的提炼,而尽可能把很多工作交给机器去做。在这种意义之下,现在的人工智能的行业应用起到的是一个赋能、赋值的作用,很难说与任何一个行业形成所谓的交叉。因为我理解的交叉学科定义可能更严格一点。当前还是计算技术、人工智能技术或者信息技术在某一个行业更为深度的应用,这是我理解的当前人工智能技术与行业结合所处的阶段。

陈杰:现在人工智能包含与人文学科的交叉,它的安全性、伦理性、健康性可能涉及人文科学、社会科学、心理学、哲学等,这些问题可以从哪方面切入?

梅宏:这是一个很复杂的问题,我想讲两个方面。第一方面,毫无疑问,人工智能相关的技术对传统人文学科有一个赋能作用,是一个很好的助手。怎样用人工智能助力传统的人文学科的研究,是值得关注的问题。此外,我们需要关心的不仅仅是人文学科、社会学科的科研问题,更多的应该是科技以人为本,为人类生存发展、为我们更好的幸福生活提供科技的能量。这是科技给我们人类在人文学科带来的重大意义。

第二方面,大数据、人工智能带来的所谓“偏见”,以及人工智能进一步发展会不会侵犯人的生存空间、工作空间,这些伦理方面的问题是社会所关注的,我们应该给予高度的重视。前段时间我们中国计算机学会成立了一个计算伦理相关的委员会,就在讨论邀请伦理学家和我们计算机领域学者一起合作。我们的总体目标是科技为人,科技向善,希望科技让人生活得更美好,而不是给我们带来新的困扰。当然科技发展总是双刃剑,我们要尽可能让它向有利的方面发展。我认为很多科研可能都是不应该做的,当某项技术给人类带来的危害相比福祉更大的时候,我们宁愿不做它。

何积丰:伦理是一个问题,第二个问题是现在基于机器学习算法的公平性问题。我们知道数据本身有偏向性,最后用基于带有偏向性数据得到的数学模型做决策的时候,可能会产生不公平的结果。讲到公平,大家会讨论是什么意义下的公平,有很多不同的描述办法。比如说三个人去看足球赛,站在一个篱笆前面,你给每个人一张椅子坐在上面看,我们认为是公平的,因为每个人待遇是一样的。但是有的人比较矮一点,有的人比较高一点,如果真的要让大家都看到球赛,那我可能给矮的那位观众提供的凳子稍微高一点,这些都是要讨论的一个问题。此外,还有科技发展和社会发展以及与人为善的关系,也是哲学家很关心的。哪些工作会被淘汰,什么新的工作补上去,这个问题大家都要预先做准备,我相信这跟人文科学有很大关系。我们中国古代哲学里面很早就讨论认知问题,讨论了几千年,也给我们留下一些好的东西,证明古人在生活中也碰到所谓科学发展对他们生活的影响的问题。因此我的理解是,人文科学参与是从另外一个层面判别科学发展的方向。

张成奇:还是以自动驾驶为例,很多人关心自动驾驶是怎么样安全、准确、高效地驾驶一辆汽车。实际这只是一个方面,还有一个很重要的方面,是研究许多车的协同调度。像现在滴滴调度是有司机的,如果所有的车变成自动驾驶,要怎么调度?这个调度需要满足坐车的人的隐私保护,以及舒适、快速、经济的需求,这里面需要很多经济学的知识,使人既省钱又舒适,又可以快速到达目的地。

但是另外一个方面,很多新技术都是双刃剑。如在自动驾驶领域,怎样防止黑客劫持你的自动驾驶的车辆?如果你的车被劫持了,你自己根本控制不了,这种情况下危险就很大了,这就属于技术的双刃剑。更要防止一件事情:有没有黑客用自动驾驶的技术,制造远程的武器。作为研究自动驾驶的人,这个方面也要考虑,但是这不仅仅是技术问题,还涉及一些法律问题。这个双刃剑需要提上议事日程,既保护隐私,还要安全驾驶、防止黑客,又要防止自动驾驶技术被某些人当成远程武器利用,在法律上,这需要全世界联手。

陈杰:当前人工智能发展这么快,对人工智能领域的人才培养模式创新上有哪些思路、想法?

张成奇:我谈两个维度。第一,师资不足的问题怎么解决?现在各个高校都开人工智能的课,包括一些大专、技校,上哪找这么多师资?这个课程不是说听听讲座就可以的。师资不足的问题,我的想法是现在因为疫情的原因,网课流行,反倒给我们提供了一个契机,就是怎么样搞跨校联盟。假如说三五个学校或者是更多的学校搞一个联盟,共同设计人工智能的课程,用各个学校的师资,把线上线下结合起来,这样就可以解决培养人工智能人才的师资问题,这是一个建议。第二,人工智能课需要实习,而不仅仅是上课,学数学、计算机,学生需要很强的动手能力、实践能力。大家通常都说要产学研结合,我个人在大约3年前有一个想法,一直没有实现。那就是要建立数据平台、算力平台、行业平台。所以我一直在想能不能上海市牵头,和企业、大学成立一个人工智能乐园。所谓人工智能乐园,就是现在所有人工智能实验产品都放在乐园里,既当作一个演示,又可以当作一个实习平台。如果能够合作建造一个人工智能乐园,既把人工智能所有的产品当做娱乐产品,同时又建立一个大的实验平台,不管是数据平台、算力平台、场景平台,让研究生甚至研究者可以到这里来实习,同时又可以让企业来展示他们的产品。

陈杰:人工智能对我们大学的学科建设,特别是学科交叉融合,有什么启迪?

梅宏:毫无疑问,人工智能和其他学科交叉融合是大势所趋。人工智能相关的技术对别的行业的科研会产生非常重要的影响。大家知道数据密集型科学或者说第四范式,也是在特定的时代被提出的,是随着信息技术发展而出现的新的科学范式,是在已有的实验观测、理论推演和计算仿真之外的新的数据密集型科学范式。因此,对于当下的高校学科建设来说,很多传统的学科在培养人才时要加强对数字化方面知识的传授,因为我们现在正在进入崭新的数字化时代,数字化生存是未来在这个社会生存的每一个人都会面临的事情。

大家可以想想,随着技术的进步,未来我们会用什么样的方法来求解问题?早期我们上大学的时候要学拉计算尺、查计算表,很多的计算要靠人工来做的。当计算机出现以后,很多事情不需要人工来做了。未来解决问题,我们要用数据的思维、计算的思维解决,很多问题就是先建模,然后由计算机解决。我们想很多的学科,包括传统的机械,其他的人文学科等等,可能都会使用这样的方法。

我想说的另外一件事是,人工智能人才缺乏的问题。大家都在讲人才培养的问题,我就在想一个问题,到底缺什么人?缺不缺做研究的人?我以为缺,但不是那么缺,因为当前人工智能技术还是传统技术路径的新发展和延续,当前人工智能的研究还有着大量传统人才的储备。我觉得从研究层面上,不是那么缺,缺的是前沿、高端的研究人才,更缺的是产业界急需的人才。回过来看,产业界急需的人才该怎么培养?它需要的人才是什么?我个人对咱们国家那么多的知名高校办狭义的人工智能专业持保留意见。我认为大学本身,特别是顶级大学,还是以通识教育、创新教育为主,让我们学生有未来发展的潜力。我认为顶级高校没有必要,也不应该,把它的定位主要定在为现有的企业培养马上能用的人才。当然我国的教育体系中应该分出一类高校,针对性地培养能够进行数据分析、进行人工智能技术落地等的应用型人才。这是现实问题,我们需要大量的应用型人才,但是这些人才不应该是交大、复旦、同济、华师大这样的学校作为本科生来培养。

我认为人工智能或者信息技术是未来改造所有学科特别是工程学科往轻量化方向走的一个很重要的方面。也就是说,未来所有的学科都会涉及和信息的紧密融合,不一定是与人工智能技术交叉,但AI技术在计算、控制相关的很多基础教学中,以及在各个学科的知识体系构造方面,应该要起到一个重要的基础知识的作用。但是我们是不是一定要把所有的工程学科往这个方向发展?我们所有高校的人才培养,是不是一定要以当前企业最急需的一批能动手的工程师为导向,我觉得要画大大的问号,这是我站在高校之外对人工智能学科建设的一些反思。

陈杰:我们现在的人工智能和其他学科专业的交叉融合非常多。那么,从学界、业界、政府三个层面来看,下一步要怎么样布局?怎么样进行全面合作?各方承担什么样的责任,发挥什么样的角色作用,才能推动人工智能的快速发展?

何积丰:政府应该提供相应政策,以鼓励企业和高校、科研院所合作。现在最大的问题可能还是我们教学科研跟企业之间的两张皮怎么贴在一起的问题,这个问题已经讨论很长时间了,我觉得有几个办法。

一是在学生的学业阶段,应该尽早让他们参加一些科研项目,慢慢培养找到问题、分析问题、解决问题的能力,这是创新的基础,如果分析问题能力都没有,创新就谈不上,这是第一个。

二是要鼓励高校的教师和企业的技术人员有某种意义的业务沟通。任何人工智能应用,离开行业知识是不可能的,如果我们都想做应用,然后一条河的两边,一边搞科研、一边搞应用,始终手牵不起来。所以我认为应该用这样的方式,鼓励教师跑到企业去,也鼓励企业工程技术人员跑到学校来,这种互动应该说相关的政策已经有了,但是落地比较少。

三是在培养方向上,我们既要培养有基础研究才能的人才,也要培养能工巧匠,这和我们早期讲的能工巧匠是非常不一样的。譬如说大家现在搞数字化,要搞数字孪生,如果建模建不了,怎么搞数字孪生?也不能叫数学系和计算机的老师都帮你做模型,因此人员沟通是非常重要的。

【注释】

[1]即心语假说(Language of Thought)。——编者注

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈