杨强:下面要讨论的是人工智能所面临的一些短板,也许这些短板能够激励我们推动人工智能下一个10年的发展。从我自己的经验来说,我觉得人工智能在基于现有的经验进行学习,然后拓展适应不断变化的环境这方面做得不足。在AI领域我们把这叫作“迁移学习”。我们过去一直希望在理论和现实层面上都实现机器的举一反三,或者是它的适应性,来进行推理。人类就是这么做的,但机器在这方面还需要努力。此外,在隐私方面,我们从其他人手中拿数据的时候,是有隐私泄露风险的,别人可能不想和我们分享数据。这也是当前人工智能的挑战,人工智能没有办法去整合和获取真正的大数据。
戴文渊:迁移学习的确是人工智能面临的一个大挑战,现在我们看到人工智能的应用越来越多了,但是在复杂的环境当中,迁移学习的使用更加重要。举一个例子:我昨天去拜访了一家餐饮巨头企业,他们想要把线下的业务放到线上去,改变业务的模式。过去,他们的店大部分在线下;但疫情之后,仅有5%的营收是来自线下的,其余95%的营收是来自线上的,是通过数字化的渠道来的。此前,他们会让服务员给来店的客户送一些优惠券,通过服务员人工为客户提供一些建议,做增值推荐服务。他们觉得,要把推荐服务放到线上去很难。首先就是需要大量的数据科学家来完成这项工作,但在AI人才紧缺的当下,企业也无能为力。所以我们觉得需要让普通开发者能够开发AI应用,以解决数据科学家紧缺的问题。这也是为什么5年前第四范式就开始把很多时间投入AutoML(自动机器学习)技术的研究上,它可以让普通开发者—比如说JAVA开发师和Python工程师—都可以构建AI应用。
第二个挑战,即使有足够多的科学家,即使普通开发者也可以开发AI技术,但企业还是缺少可用的数据。我们必须利用迁移学习,把知识从一个领域迁移到另外一个领域,以解决某些领域数据量不足的问题。第四范式在迁移学习领域积累了很多优秀的算法,同时我们一直坚持系统本身需要解决好隐私的问题。最近几年,我们在迁移学习隐私保护领域取得了比较大的突破,能够把知识从一个领域迁移到另外一个领域,同时也不会导致隐私暴露。
第三个挑战是成本问题。我们发现顶尖的互联网公司每年都要在搜索引擎上花掉上千万元,很少有公司能够接受这样的投入成本,所以我们必须考虑AI的成本问题。AI体系不仅仅是硬件体系,还有软件体系,软件的设计必须基于硬件,硬件的设计也必须适配软件,这是一个软硬件优化、融合的体系。第四范式正在以融合的方法来设计软件和硬件,我们的“软件定义算力”技术让数据中心的TCO(总拥有成本)表现增加了10倍。
中岛秀之:我觉得我们可能都有共识,那就是要加强深度学习的能级。在这方面我们的技术还有待改良和提高,我们需要把这些技术能够在更高领域的任务上进行应用。
托比·沃尔什:我想快速讲讲几个挑战。第一是语言。语言是一个基础的引擎,让机器能够读懂语言是非常重要的。当前,机器并没有在语意层面上理解人的话,它可能只是表面上理解人的话。我觉得语言是机器智能化的体现。第二是常识。可能最有名的一个例子就是:你可以跑到一个城市里面,找一所学校,问学生一些历史问题,学生可能会回答得非常清楚;但是你如果让AI去做的话,有一些东西它可能会混淆,因为它缺乏一些基本的常识。第三是有关情感的问题。机器并没有感情,没有办法产生共情,或者跟人形成相关的互动、交互,这是一个比较大的挑战。
张潼:我非常同意的一点是,当前AI没有办法做自然语言和语义的识别。之前我们说过,可能有一些特定的任务,AI是可以做好的,对一些特定的环境,我们可以依托大数据来做相应的文本对比。但是对于通用的任务或者是更加广泛的任务,当前的人工智能是无法做到的,而我们真正的目标是希望人工智能能够做通用的任务,而不是一些固定环境中的单一特定的任务。比如说,我们希望能够将常识注入人工智能里面,让它在思考、逻辑推理的时候变得更强,但这是非常难的事情。目前的AI系统并不是依托我们的常识,而是依托数据的对比,做出一些概率的推测,这和人的常识是完全不一样的。即使我们只做单一任务,但有不同的应用环境、不同的数据特点,这个时候AI可能没有办法在不同环境之下用统一模型完成一个任务,这也是我们现在要解决的事情,要让AI有更强的对不同背景环境的适应能力。(www.xing528.com)
对于我们来说,让AI解决常识任务、通用任务有非常大的挑战。在未来10年中,AI做单一任务时对不同场景的适应能力也是非常重要的,并且是更加急需解决的事情。比如,我们有一些图像识别系统可以做很好的室内图像识别,但是如果希望把它放到室外场景当中应用,就需要进行一系列相应的调整。同样,无人驾驶也是如此,实际应用中会碰到在训练时从没有发生过的情况,提升对这些情况的鲁棒性也是非常重要的挑战。如何应对这样特定任务在多场景中的适应性要求,是当前更紧迫的工作。如果我们能够做到这一点,AI在很多行业的应用就会变得非常简单。原本每一个特定的AI系统只能适用于一个特定的行业,但是将来它就可以适用于不同的场景、环境和行业。这样的话,人工智能能够使用的范围更广,而且安全性更高。至于说如何从大数据变成小规模数据,这涉及迁移学习的能力。正如我提到的,我们需要做的就是让人工智能适应不同场景,这也是迁移学习需要解决的非常重要的挑战。还有,需要注意到隐私的问题。如何在不同机构使用人工智能,将其运用到不同设备当中去?如何协同合作?这也是非常重要的事情。
郭毅可:从根源上来看,AI面临一个基本的挑战,就是如何识别知识和数据,进行数据和知识的互动。通过观察来获得相应的数据和知识,很多时候就涉及应用知识的问题。比如迁移学习,你学习到一些知识后,必须能够举一反三,触类旁通。又如小规模数据的学习,你必须要让数据和知识之间进行交融。通过学习,知识会不断增加,但是你必须能够理清这一系列相应的知识,将数据和知识结合起来,这非常重要。统计学中的贝叶斯理论也强调依托之前得到的经验,将其作为学习的基础,知识和数据融合还涉及控制理论、自动化理论等。
从根本上说,未来最大的挑战就是知识和数据的融合。我认为应该坚持这样一个理念:无论是前面所说的计算机理论,或者是统计学理论,我们永远不应当持有任何偏见,应当双管齐下,同时关注知识和数据的融合,这样才能更好地建模,才能有更好的逻辑。在这样的基础之上,我们就可以更好地规约不同的数据,更好地理解数据,让数据发挥更好的效用。这非常重要,也是我们一直想要实现的目标。
中岛秀之:目前为止,数据能够运用的场景还是比较有限的,我觉得未来它应当是以一种更加智能的方式,进行更好的应用,而且人和AI能够有更好的沟通和交互。我们应该更好地向AI赋予价值系统和价值观。价值观确实是非常重要的,但是对于AI来说,它是没有办法能够理解的。我们要训练AI,让它有这样的价值观,或者是所谓的常识观。我不知道其他的技术是否能够帮助我们,但我觉得价值观是非常重要的事情。
托比·沃尔什:我们有的时候会让机器来接管部分工作,但是如果机器做了所有的事情,我们是否会变得更懒惰?我们是否会变得一无是处?我们的挑战就是要保证机器不会彻底取代人类,不会接管人类所有的事情,我们必须要有所掌控。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。