机器学习指的是计算机无须遵照显式的程序指令,而只依靠数据来提升自身性能的能力。自20世纪50年代以来,我国机器学习的研究大概经历了4个阶段。第一阶段是在20世纪50年代中叶至60年代中叶,属于热烈时期。在这个时期,所研究的是“没有知识”的学习,即“无知”学习;其研究目标是各类自组织系统和自适应系统;指导本阶段研究的理论基础是从20世纪40年代开始研究的神经网络模型。第二阶段在20世纪60年代中叶至70年代中叶,被称为机器学习的冷静时期。该阶段的研究目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。第三阶段从20世纪70年代中叶至80年代中叶,被称为复兴时期。在这个时期,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和各种学习方法。该阶段已开始把学习系统与各种应用结合起来,中国科学院自动化研究所进行质谱分析和模式文法推断研究,表明我国的机器学习研究得到恢复。1980年,西蒙来华传播机器学习的火种后,我国的机器学习研究出现新局面。机器学习的最新阶段(即第四阶段)始于1986年。一方面,由于神经网络研究的重新兴起;另一方面,对实验研究和应用研究得到前所未有的重视,我国的机器学习研究开始进入稳步发展和逐渐繁荣的新时期。
机器学习按照实现途径划分可分为符号学习、连接学习、遗传算法学习等。符号学习采用符号表达的机制,使用相关的知识表示方法及学习策略来实施机器学习,主要有记忆学习、类比学习、演绎学习、示例学习、发现学习、解释学习。记忆学习即把新的知识储存起来,供需要时检索调用,无需计算推理。比如,考虑一个确定受损汽车修理费用的汽车保险程序,只需记忆计算的输出输入,忽略计算过程,从而可以把计算问题简化成存取问题。类比学习即寻找和利用事物间的可类比关系,从已有知识推出未知知识的过程。演绎学习即由给定的知识进行演绎的保真推理,并存储有用的结论。示例学习即从若干实例中归纳出一般的概念或规则的学习方法。解释学习只用一个实例,运用领域知识,经过对实例的详细分析,构造解释结构,然后对解释进行推广得到的一般性解释。连接学习是神经网络通过典型实例的训练,识别输入模式的不同类别。典型模型有感知机、反向传播BP网络算法等。遗传算法学习模拟生物的遗传机制和生物进化的自然选择,把概念的各种变体当作物种的个体,根据客观功能测试概念的诱发变化和重组合并,决定哪种情况应在基因组合中予以保留,如图9-2所示。
机器学习的应用范围非常广阔,针对那些产生庞大数据的活动,机器学习几乎拥有改进一切性能的潜力。同时,机器学习技术在其他的认知技术领域也扮演着重要角色,如计算机视觉,它能在海量的图像中通过不断训练和改进视觉模型来提高其识别对象的能力。(www.xing528.com)
图9-2 机器学习的主要方法
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。