人工智能的目标包括:
·知识表示和推理包括:命题演算和归结,谓词演算和归结,可以进行一些公式或定理的推导。
·自动规划包括机器人的计划、动作和学习,状态空间搜索,敌对搜索,规划等内容。
·机器学习是用来帮助机器和软件进行自我学习来解决遇到的问题。
·自然语言处理是用来帮助机器与真人进行沟通交流。
·计算机视觉是用来辨认和识别机器所能看到的物体。
·机器人学是用来给一个机器赋予实际的形态以完成实际的动作。
1.知识的表示和推理
知识表示包括:基于知识的系统,表示常识知识等。传统的知识表示已经很成熟了,包括了描述逻辑,也包括了语义网(资源描述框架RDF)。知识推理建立在逻辑上,首先需要庞大的数据集,比如freebase;其次需要关系抽取自动化工具;最后需要合理的知识存储结构,比如资源描述框架RDF。谷歌提的知识图谱概念就是一种知识工程,它有庞大的知识库和基于知识库的各种服务。早年业界研究的知识本体也是一种知识工程,研究成果有FrameNet、WordNet、中文知网HowNet等。
IBM在2011年研发了Watson问答系统。谷歌在2012年提出知识图谱,作为谷歌的两大重要技术储备,一个是深度学习,形成了谷歌大脑;另一个就是知识图谱,用来支撑下一代搜索和在线广告业务。Facebook公司利用知识图谱技术构建兴趣图谱,用来连接人、分享的信息等,并基于此构建了graph search。其他的工业应用还有:SIRI、EVI、Google Now、Dbpedia、freebase等。
2.自动规划
提到自动规划的首先要说一下有限状态机(FSM),一般应用于游戏机器人,网络协议,正则表达式,词法语法分析,自动客服等。
其次是状态空间搜索,最简单粗暴的是盲目搜索,就像特斯拉评价爱迪生:“如果说有一根针掉进草垛了,让他去找,他会毫不犹豫的,一根一根草挑出来找”。优化改进的版本是启发式搜索。这方面的应用有国际象棋Deepblue,围棋AlphaGo。AlphaGo在蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)基础上使用了深度学习、监督学习和增强学习等方法。“蒙特卡洛树搜索”是一类启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,始终保证选取当前抽样中的最优策略从而不断接近全局最优,确定每一步棋应该怎么走才能够创造更好机会。另外还包括:计划、动作和学习,敌对搜索,基于逻辑的规划方法,状态演算等内容。
3.机器学习
机器学习是一门从数据中研究算法的多领域交叉学科,研究计算机如何模拟或实现人类的学习行为,根据已有的数据或以往的经验进行算法选择、构建模型,预测新数据,并重新组织已有的知识结构使之不断改进自身的性能。
换一种说法,机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达,如图7-9所示。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。
通常学习一个好的函数,分为以下三步:
1.选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。
2.判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。
3.找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。(www.xing528.com)
学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。
4.自然语言处理(Natural Language Processing,NLP)
自然语言处理是人工智能的另一个目标,用于分析、理解和生成自然语言,以方便人和计算机设备进行交流,以及人与人之间的交流。它的应用领域包括:机器翻译,文本、语音、图片转换,聊天机器人,自动摘要,情感分析,文本分类,信息提取等。图7-10给出了自然语言处理简要的知识架构图。
图7-9 机器学习
图7-10 自然语言处理的知识架构
5.计算机视觉
视觉对人很重要,人类获得讯息90%以上是依靠眼睛的,那么对于计算机要想获得人获取信息的能力,重点是解决计算机视觉系统。目前计算机视觉已经可以做到很多事情,比如识别人脸、标志和文字;探测物体并了解其环境的应用,如自动驾驶无人车等;检测的事件,对视频监控和人数统计;组织信息,如对于图像和图像序列的索引数据库;造型对象或环境,医学图像分析系统或地形模型;自动检测,如在制造业的应用程序。
6.机器人学和强人工智能
机器人学是一个交叉学科,主要研究包括环境适应机器仿生,机器人自主行为,人机协作,制造装备机器人、科学工程机器人、服务型机器人等。目前国内的机器人行业还没有形成规模,商业化做得好的比如大疆、沈阳新松机器人公司。
强人工智能是人工智能研究的最主要目标之一,强人工智能也指通用人工智能(artificial general intelligence,AGI),或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。实现强人工智能至少需要拥有以下能力:
·自动推理,使用一些策略来解决问题,在不确定性的环境中作出决策;
·知识表示,包括常识知识库;
·自动规划;
·学习;
·使用自然语言进行沟通;
·整合以上这些手段来达到同一个的目标。
目前的强人工智能还只能出现在电影或小说里,比如斯皮尔伯格导演的《人工智能》里面的机器男孩大卫。
人类智慧是人类的“隐性智慧”与“显性智慧”相互作用相互促进相辅相成的能力体系。其中,“隐性智慧”主要是指人类发现问题和定义问题从而设定工作框架的能力,由目的、知识、直觉能力、抽象能力、想象能力、灵感能力、顿悟能力和艺术创造能力所支持,具有很强的内隐性,因而不容易被确切理解,更难以在机器上进行模拟;“显性智慧”主要是指人类在隐性智慧所设定工作框架内解决问题的能力,依赖于收集信息、生成知识和创生解决问题的策略并转换为行动等能力的支持,具有较为明确的外显性,因而有可能被逐步理解并在机器上模拟出来。
目前,几乎所有的人工智能都只能模仿人类的解决问题的能力,而没有发现问题、定义问题的能力。因此,“人工智能将全面超越人类智慧”的说法没有科学根据,目前的人工智能只是帮助人类提高生产力的工具而已。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。