首页 理论教育 人工智能、机器学习与深度学习间的关系

人工智能、机器学习与深度学习间的关系

时间:2023-11-20 理论教育 版权反馈
【摘要】:人工智能与机器学习、深度学习的技术发展密不可分,因此很多人容易将三者混淆,下面将对新一代人工智能的表现形式以及机器学习、深度学习在其中的主导作用进行剖析。这也是很多传统机器学习算法共同面临的一个问题。深度学习是机器学习的一个分支,它除了是学习特征和任务之间的关联以外,还能自动地从简单特征中提取更加复杂的特征。虽然深度学习领域的研究人员相比其他机器学习领域更多地受到了大脑工作

人工智能、机器学习与深度学习间的关系

人工智能与机器学习、深度学习的技术发展密不可分,因此很多人容易将三者混淆,下面将对新一代人工智能的表现形式以及机器学习、深度学习在其中的主导作用进行剖析。

计算机发明之初,人们就希望它能够帮助甚至代替人类完成重复性、高度复杂的脑力劳作。利用巨大的存储空间和超快的运算速度,计算机已经可以非常轻易地完成一些对于人类非常困难,但对其相对简单的问题。比如,统计一本书中不同单词出现的次数,存储一个图书馆中所有的藏书,或是计算非常复杂的数学公式,都可以通过计算机轻松解决。然而,一些人类通过直觉可以很快解决的问题,目前却很难通过计算机解决,这些问题包括自然语言理解、图像识别、语音识别等,是人工智能需要重点解决的问题。

计算机要像人类一样完成更多智能的工作,需要掌握关于这个世界海量的知识,比如要实现汽车自动驾驶,计算机至少需要能够判断哪里是路,哪里是障碍物。这个对人类非常直观的东西,对计算机却是相当困难的。路有水泥的、沥青的,也有石子的,甚至是土路,这些不同材质铺成的路在计算机看来差距非常大。如何让计算机掌握这些人类看起来非常直观的常识,这对于人工智能的发展是一个巨大的挑战。

很多早期的人工智能系统只能应用于相对特定的环境,在这些特定环境下,计算机需要了解的知识很容易被严格并且完整定义。例如,IBM的深蓝在1997年打败了国际象棋冠军卡斯帕罗夫。设计出下象棋软件是人工智能史上的重大成就,但其主要挑战不在于让计算机掌握国际象棋中的规则。国际象棋是一个特定的环境,在这个环境中,计算机只需要了解每一个棋子规定的行动范围和行动方法即可。

为了使计算机更多地掌握开放环境下的知识,研究人员进行了很多尝试。其中一个影响力非常大的领域是知识图库。虽然使用知识图库可以让计算机很好地掌握人工定义的知识,但建立知识图库一方面需要花费大量的人力、物力,另一方面可以通过知识图库方式明确定义的知识有限,不是所有的知识都可以明确地定义成计算机可以理解的固定格式,很大一部分无法明确定义的知识,就是人类的经验。比如,我们需要判断一封邮件是否为垃圾邮件,会综合考虑邮件发出的地址、邮件的标题、邮件的内容以及邮件收件人的长度等。这是收到无数垃圾邮件之后总结出来的经验。这个经验很难以固定的方式表达出来。而且不同人对垃圾邮件的判断也会不一样。如何让计算机可以跟人类一样从历史的经验中获取新的知识呢?这就是机器学习需要解决的问题。

卡内基梅隆大学的Tom Michael Mitchell教授在1997年出版的书籍《机器学习》中,对机器学习进行了非常专业的定义,这个定义在学术界被多次引用。在这本书中机器学习被定义为:如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称这个程序可以从经验中学习。下面通过垃圾邮件分类的问题来解释机器学习的定义。在垃圾邮件分类问题中,一个程序指的是需要用到的机器学习算法,比如逻辑回归算法;任务T是指区分垃圾邮件的任务;经验E为已经区分过是否为垃圾邮件的历史邮件,在监督式机器学习问题中,这也被称为训练数据;效果P为机器学习算法在区分是否为垃圾邮件任务上的正确率。

在使用逻辑回归算法解决垃圾邮件分类问题时,先从每一封邮件中提取对分类结果可能有影响的因素,比如说上面提到的发邮件的地址、邮件的标题及收件人的长度等。每一个因素都被称为一个特征。逻辑回归算法可以从训练数据中计算出每个特征和预测结果的相关度。比如,在垃圾邮件分类问题中,可能会发现一个邮件的收件人越多,那么该邮件为垃圾邮件的概率也就越高。在对一封未知的邮件做判断时,逻辑回归算法会根据从这封邮件中提取到的每一个特征以及这些特征和垃圾邮件的相关度来判断这封邮件是否为垃圾邮件。

在大部分情况下,在训练数据达到一定数量之前,训练数据越多,逻辑回归算法对未知邮件做出的判断越精准。也就是说逻辑回归算法可以根据训练数据(经验E)提高在垃圾邮件分类问题(任务T)上的正确率(效果P)。之所以说在大部分情况下,是因为逻辑回归算法的效果除了依赖于训练数据,也依赖于从数据中提取的特征。假设从邮件中提取的特征只有邮件发送的时间,那么即使有再多的训练数据,逻辑回归算法也无法很好地利用。这是因为邮件发送的时间和邮件是否为垃圾邮件之间的关联不大,逻辑回归算法无法从数据中习得更好的特征表达。这也是很多传统机器学习算法共同面临的一个问题。(www.xing528.com)

类似从邮件中提取特征,如何数字化地表达现实世界中的实体,一直是计算机科学中一个非常重要的问题。如果将图书馆中的图书名称储存为结构化的数据,比如储存在Excel表格中,那么可以非常容易地通过书名查询一本书是否在图书馆中。如果图书的书名都存在非结构化的图片中,那么完成书名查找任务的难度将大大增加。

如果通过笛卡儿坐标系来表示数据,那么不同颜色的点无法被一条直线划分。如果将这些点映射到直角坐标系,那么使用直线划分就很容易了。同样的数据使用不同的表达方式会极大地影响解决问题的难度。一旦解决了数据表达和特征提取,很多人工智能的任务也就解决了90%。

然而,对许多机器学习问题来说,特征提取不是一件简单的事情。在一些复杂问题上,要通过人工方式设计有效的特征集合,需要很多的时间和精力,有时甚至需要整个领域数十年的研究投入。例如,要想从很多照片中识别有汽车的照片,现在已知的是汽车有轮子,所以希望在图片中提取“图片中是否出现了轮子”这个特征。但实际上,要从图片的像素中描述一个轮子的模式是非常难的。虽然车轮的形状很简单,但在实际图片中,车轮上可能会有来自车身的阴影、金属车轴的反光,周围的物品也可能会部分遮挡车轮,实际图片中各种不确定的因素让我们很难直接提取这样的特征。

既然人工的方式无法很好地提取实体中的特征,那么是否有自动的方式呢?答案是肯定的。深度学习解决的核心问题之一就是自动地将简单的特征组合成更加复杂的特征,并使用这些组合特征解决问题。深度学习是机器学习的一个分支,它除了是学习特征和任务之间的关联以外,还能自动地从简单特征中提取更加复杂的特征。

虽然深度学习领域的研究人员相比其他机器学习领域更多地受到了大脑工作原理的启发,而且媒体界也经常强调深度学习算法和大脑工作原理的相似性,但现代深度学习的发展并不拘泥于模拟人脑神经元和人脑的工作机理。模拟人类大脑也不再是深度学习研究的主导方向。因此,我们不能简单地认为深度学习是在试图模仿人类大脑,目前科学家对人类大脑学习机制的理解还不足以为当下的深度学习模型提供指导。

现代的深度学习已经超越了神经网络科学的观点,可以更广泛地适用于各种并不是由神经网络启发而来的机器学习框架。值得注意的是,有一个领域的研究者试图从算法层面理解大脑的工作机制。这种算法不同于深度学习领域,被称为计算神经学。深度学习领域主要关注如何搭建智能的计算机系统,解决人工智能中遇到的问题。计算神经学则主要关注如何建立更准确的模型来模拟人类大脑的工作。总的来说,人工智能、机器学习和深度学习是非常相关的几个领域。人工智能需要解决的是一类非常广泛的问题,机器学习是解决这类问题的一个重要手段,深度学习则是机器学习的一个分支。在很多人工智能问题上,深度学习的方法突破了传统机器学习方法的瓶颈,推动了人工智能领域的发展。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈