人工神经网络(artificial neural network,ANN)是模拟人类大脑建立起来的一种由大量的神经元(节点)构成的神经网络结构。每个节点代表一种特定的输出函数,称为激励函数(activation function)。节点之间是有关联的数值网络计算模型,每两个神经元之间连接依赖一个加权值来定义。通过不同的连接方式,加权值和激励函数就可以实现不同的人工神经网络。
图1-2 神经元结构图
人脑神经元的结构由轴突、细胞体和树突组成,如图1-2所示。树突是用来接收信号的,神经细胞体内有一个细胞核,细胞核可以处理信号,轴突也有很多分支,通过轴突神经末梢和其他细胞树突接触可以把信号传达出去。神经元之间的信息交换是通过电化学信号传递的,虽然这个生物神经传输的过程是很复杂的,但是利用这个传输的原理可以让计算机能够建立数字的神经网络,从而实现分析信息的功能,这就是人工神经网络。人脑的神经网络有哪些功能,我们就希望计算机也具备哪些功能,虽然和人脑相比人工网络会相对简单,但这样也能够让计算机实现一些智能的判断。
人类大脑具备的功能有:无监督学习能力、对损伤有冗余性、处理信息速度快、善于归纳推广、有意识。根据人脑的功能,人工神经网络现阶段的主要目的就是实现学习和处理信息,其他几方面则是人工智能未来发展的方向。以无监督学习为例来说,人类大脑可以自己进行学习,不需要监督其完成的对错与质量,当一个神经元经常接收到某一个细胞传来的某种信号,那么这个细胞就会因为这个信号的到来而变得更加“兴奋”,这个“兴奋”的程度是跟信号刺激的频率和强度有关的,当这个信号传输越来越弱,那么该细胞的“兴奋”程度会随之降低。这就是神经元自行进行学习和训练的过程,如果将这个过程转化为计算机程序,我们就可以实现一种无监督的电脑自行计算和优化的过程。
比如我们经常会采用的机器学习算法就是分类,对于分类来讲有两种方式来实现,有监督的学习过程就是训练数据是有标签的。标签文件的作用是告诉计算机哪个是我们感兴趣的信息,比如图像识别。所标注出来的各种需要识别的物品、动物、人等,都需要先告诉计算机这个需要识别的东西的名字是什么,它在图片的哪个位置,这样计算机才能根据这个标签来进行学习。(www.xing528.com)
无监督学习的数据集是不包含标签文件的,无监督学习一般就是聚类算法。聚类算法发展还是比较缓慢的,现阶段较为常用的无监督学习方法主要有主成分分析方法(principal component analysis,PCA)、等距映射方法(isometric feature mapping,Isomap)、局部线性嵌入方法(locally linear embedding,LLE)、拉普拉斯特征映射(Laplacian eigenmaps)和局部切空间排列方法(local tangent space alignment,LTSA)。无监督学习虽然从原理上看更加自由、功能更加强大,但是在算法上却很难实现,现在较为常用的这些无监督学习方法都是采用降维的思想来完成,数据的复杂度往往都很高,这些算法在降维过程中会把大量的原始信息当作次要信息忽略掉,而这些信息有时却有着关键的作用。
无监督学习一般有两种类型:确定型和概率型。确定型无监督学习是指通过稀疏编码还原出原始信息,通过学习给出一个函数,让编码后的数据尽可能和可见层数据相等,这种算法在测试样本和训练样本相差较大时会出现较大的偏差。概率型无监督学习是通过受限制玻尔兹曼机(restricted Boltzmann machine,RBM)从可见层数据计算出隐含层的状态。所谓RBM就是通过输入数据集的概率分布随机生成神经网络。现阶段在RBM的基础上又衍生出了深度置信网络(deep belief network,DBN)和深度玻尔兹曼机(deep Boltzmann machine,DBM)等多种无监督深度学习算法。
无监督学习现在已经成功应用于协同滤波、分类、降维、图像检索、信息检索、语言处理、自动语音识别、时间序列建模、文档分类、非线性嵌入学习、暂态数据模型学习和信号与信息处理等任务。RBM在降维、分类、协同过滤、特征学习和主题建模中也得到了应用。
无监督学习算法更接近人脑的神经网络功能,但其实现起来还有很大技术困难。相对来说,有监督学习可以更好地完成识别和分类等人工智能的功能,比如语音识别和图像识别等各种卷积神经网络算法,虽然有监督学习要耗费很多的时间和精力来进行标注,但是其算法更加成熟稳定。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。