首页 理论教育 探索人机世界的新型学习

探索人机世界的新型学习

时间:2023-06-13 理论教育 版权反馈
【摘要】:如果把人工智能比喻成刚出生的婴儿的大脑,那么机器学习就是让孩子逐渐拥有对世界认知能力的过程,而深度学习是这种过程中很有效率的一种教学体系。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。目前,业界有一种较为普遍的错误意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。

探索人机世界的新型学习

人工智能进入人类的视野之后,通过什么样的方法使机器变得如此智能化?而智能机器人又是如何帮助人类完成烦琐的事务的?这一系列问题都要从人工智能所利用的技术讲起。根据应用领域的不同,人工智能研究的技术也不尽相同。目前,机器学习、计算机视觉等成为热门的AI技术方向。由此,探讨人工智能、机器学习、深度学习和强化学习之间的关系具有重要意义。

通俗来讲,在这四者之中,人工智能囊括的范围最广。其涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成刚出生的婴儿的大脑,那么机器学习就是让孩子逐渐拥有对世界认知能力的过程,而深度学习是这种过程中很有效率的一种教学体系。根据目前已有的研究来看,我们可以认为人工智能是要达到的最终目的,是结果,而深度学习、机器学习是中间途径,是工具。深度学习是机器学习领域中一个新的研究延伸点。机器学习是一种实现人工智能的路径,深度学习是一种实现机器学习的重要技术。

(一)机器学习

目前关于人工智能的科研工作与成果主要集中在弱人工智能领域,并很有希望在未来的几年内取得重大突破。大多数电影里描绘的人工智能多半是强人工智能,它们拥有特殊的“超能力”。而这种在电影里看起来已经非常具象化、似乎已经与人类密不可分的强人工智能,在目前的现实世界里却难以得到真正实现。弱人工智能有望取得突破,这种突破是如何实现的?真正的“智能”又从何而来?这主要归功于一种实现人工智能的方法——机器学习。

机器学习最基本的做法是使用算法来解析数据,并从中学习,然后对真实世界中的事件做出相关决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是利用大量的已有数据来对人工智能进行“教学”,通过各种算法从数据中学习如何完成任务。以一个简单的例子来讲,当我们在亚马逊淘宝、京东这些网上商城购物时,页面上经常会推送一些可能喜欢的商品信息,我们称之为“推荐引擎”。这是网购商城的后台系统利用特殊的信息过滤技术,根据消费者的基本信息、以往的购物记录和收藏清单中的偏好而进行计算,从而识别并筛选出其中哪些是消费者本身真正感兴趣的,并且会愿意购买的产品。这样的决策模型,可以帮助网购商城为消费者提供合理的购物建议,并帮助消费者快捷地找到自己心仪的商品,达到产品销售数量的最大化,使消费者获得满意的购物体验。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习等。研究人员不会亲手编写软件去确定特殊指令集,然后让程序完成特殊任务,相反,他们会用大量数据和算法去“训练”机器,让机器自己学会如何执行任务。因此,机器学习首先被定义为是模拟、延伸和扩展人的智能的一条路径,是人工智能的一个子集。其次,机器学习是要基于大量数据的,也就是说它的“智能”是用大量数据哺育出来的;正是因为要处理海量数据,所以大数据技术对机器学习来说尤为重要。并且,我们需要认清的是,机器学习仅仅只是大数据技术众多分支上的一个应用。常用的十大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但其每前进一步都变得越来越艰难,直到深度学习算法的出现。[16]

(二)深度学习

深度学习在初始阶段并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域高速的发展态势,一些特有的深度学习手段相继被提出,如残差网络。残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络,在2015年的ImageNet大规模视觉识别竞赛中获得了图像分类和物体识别上的优胜。残差网络的特点是容易优化,并且能够通过增加相当的深度来提高准确率。[17]越来越多的人将深度学习单独看作一种学习的方法。从时间上而言,深度学习是一个比较新的概念,严格地说是在2006年提出的。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。

最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。深度学习又分为卷积神经网络(CNN)和深度置信网络(DBN)。其主要思想就是模拟人的神经元,每个神经元接收到信息,处理完后传递给与之相邻的所有神经元即可。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少关于深度学习的想法在之前的研究中也曾有过涉猎,但由于那时能收集到的训练数据量不足、计算能力落后等,最终的研究结果不尽如人意。现代的深度学习摧枯拉朽般地实现了各种以往看来几乎不可能的任务,使得所有的机器辅助功能似乎都能够变为可能。无人驾驶汽车、预防性医疗保健等,开始逐渐进入人类生活。(www.xing528.com)

目前,业界有一种较为普遍的错误意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下深度学习在计算机视觉、自然语言处理领域的应用远远超过传统的机器学习。深度学习的基本特点是试图模仿大脑的神经元之间传递、处理信息的模式。最显著的应用是在计算机视觉和自然语言处理(NLP)领域。显然,深度学习与机器学习中的神经网络是强相关的,神经网络也是其主要的算法和手段,或者我们可以将深度学习称为改良版的神经网络算法。[18]深度学习是一种在机器学习基础上的加强版,与机器学习是和谐共生的关系,并不会完全将机器学习推翻。

此外,深度学习的学习内容是样本数据的内在规律和表示层次,学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。其最终目标是让机器能够像人一样具有对事物的分析能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。[19]

(三)强化学习

强化学习同深度学习一样,都属于一种自我学习系统。强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题[20],是一种从环境状态到动作映射的学习,目标是使动作从环境中获得的累积奖赏值最大。[21]

强化学习的自身特点在于其主要是通过反复试验来学习的。通过有限多次地执行一些行动以使结果有效性实现最大化从而确定最佳答案。也可以认为它是通过不断尝试来学习,从实践中寻找最佳解决方案。比如我们在玩走迷宫时,刚开始的时候我们难免会走到死路中,但随着走错的次数越来越多,我们慢慢就摸索到走迷宫的窍门了。这个“试错”的学习过程就是强化学习。智能机器人在进行强化学习时,它们会尝试不同的行为,从反馈结果中判断出该行为是否能够得到最优的结果,然后对能引发合适结果的行为进行记忆,也就是说,计算机在多次迭代中自主地重新修正算法,直到能做出正确的判断为止。[22]机器人制作成形后的第一步,就是让机器人学习像人类一样行走。刚开始机器人试图向前迈出一大步,结果由于左右腿迈出的步子过大而跌倒。迈出的一步和摔倒是机器人强化学习系统中的反馈点。由于这种反馈是负面的,机器人需要进行自我调整,系统会根据多个负反馈的比对最终确定机器人应该缩小迈出的步子,缩小的范围是在不断的实践中得出的,直到机器人走路不会摔倒为止。这是强化学习的一个典型的例子。

近几年出现的较强大的强化学习实验之一就是谷歌的DeepMind。谷歌的研究人员把这个工具应用到了经典的电脑游戏Atari Breakout(一个经典的打砖块游戏)上。他们把最佳目标设定成要求得分最高,DeepMind需要做的就是不断地通过移动底下的挡板来击打小球以破坏屏幕顶部的砖块。在实验的开始,DeepMind犯了很多低级错误,但很快,它就可以击败世界上最好的打砖块游戏选手了。到现在,DeepMind已经会玩近60种游戏了。因此,强化学习是通过连续的反馈来调整自身的动作以获得最优结果,是一种动态学习的过程。[23]我们所熟知的AlphaGo人工智能也是由DeepMind研发的。

除此之外,还有一种学习方式叫作深度强化学习,深度强化学习能够将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行分析和控制,是一种更接近人类思维方式的人工智能方法。[24]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈