相对于部分传统归纳法来说,贝叶斯推论能更好地还原客观事物的发生规律。这对于人工智能的自主化逻辑推导,又能有什么样的帮助呢?麻省理工学院知名学者约书亚·特南鲍姆表示:“如果我们对一件事物发生的可能性设定一个‘先验概率’,并就此建立一套验证模型,那么这套模型就会告诉我们,特定条件下这件事情发生的概率是多少。这对于计算机的信息识别、逻辑推理是有极大帮助的。”
2015年12月,3名来自不同大学的学者进行了一次联合实验。他们分别是来自纽约大学的布雷顿·雷克、多伦多大学的卢兰斯·萨拉克霍特迪诺夫以及麻省理工学院的特南鲍姆。这些学者根据贝叶斯理论编写了一道关于符号识别的程序,然后录入到相关计算机当中。然后,他们又制作了一套数据样本,其中包括人工手写的1600多个字母符号等。
针对这些字母和符号,计算机能将它们分解成简单的、互不相关的笔画,然后再从自己的知识库中寻找最为接近的样本,进行评估判断。因此,这些人工书写下极不规整的字符,都能被计算机系统识别。与此同时,这台参与实验的计算机,还能自主创建全新的字母符号,并且在书写风格上与实验样本保持一致。
从结果上来说,这次实验是成功的:诸多潦草、繁杂的字符,包括一部分梵文和藏语,都被计算机成功识别了。此外,参与实验的计算机还能利用样本信息,自主创建出相关的符号标识。而辅助完成这一目标的,正是贝叶斯理论。
对此,特南鲍姆解释说:“贝叶斯推论强调‘先验概率’,也就是说,从客观规律而言,某一件事情发生的概率到底是多少。那么,当计算机面对一个似是而非、难以评定的笔画时,它就会根据之前设定好的‘先验概率’来综合判定这个笔画的最终身份。”这就是说,贝叶斯推论能利用自己的推理模型,计算出相关图形“可能属于某一笔画”的概率,然后以此为基础,推导出相关图形“理应”代表的笔画。
我们可以利用一则关于计算机图像识别的事例来说明问题。如图5-1所示。
图5-1
假如我们在公园里或者野外看见这样一个长着长鼻子的生物,那么输入了相关贝叶斯推理模型的计算机,在面对选择提问“1.图示为猛犸象”“2.图示为老虎”的时候,会如何应答呢?(www.xing528.com)
按照贝叶斯理论,“长鼻子的生物”即为事件集,猛犸象为事件集当中的一个元素。所以关于这一则提问就应当被书写为“P(猛犸象/长鼻生物)=?”针对这一问题,计算机会作出如下判定:“P(猛犸象/长鼻生物)=P(长鼻生物似然值)×P(先验概率)”。由于猛犸象确实带有“长鼻生物”这一特征,因此P(长鼻生物似然概率)将无限接近于“1”。但是由于猛犸象早已经灭绝了,因此关于“图示为猛犸象”的先验概率为0,所以经计算得出“P(猛犸象/长鼻生物)=1×0=0”。也就是说,在贝叶斯推理的指导下,计算机不会作出“图示为猛犸象”的回答。
那么,对于第二个选项,“图示为老虎”的论断,计算机又会做如何抉择呢?与“猛犸象”不同的是,生物“老虎”并没有灭绝,因此关于这一则问题的“先验概率”接近“1”。但是,从“P(长鼻生物似然概率)”角度来说,老虎是不属于“长鼻生物”集群的,所以第二个选项卡当中“P(长鼻生物似然概率)=0”。经计算,“图示为老虎”也不是正确答案。
这就是说,在接收到这个图片信息的时候,研究者所给出的选项均不符合要求,计算机只会给出“否定”的答案。而假如我们针对这个图例再增设一个选项3——“图示为大象”,那么根据贝叶斯推理,计算机做出肯定的概率就无限接近于100%了。
当然,在实际应用当中,计算机遇到的识别样本会复杂得多。但是经过多次的内部解析处理,这些繁复的样本都会被转化为简单的信息符号,进而通过贝叶斯推理顺利地完成智能化推理。
从另一个方面来说,特南鲍姆等人所进行的“手写字符识别”实验,对于贝叶斯理论的进一步发展产生了积极影响。因为从结果上来说,人类可以操控计算机进行部分逻辑方面的自主化推理创作:在对实验样本进行识别后,计算机还根据贝叶斯推理创作出了与样本书写风格一致的文字符号。对于这样一个结果,特南鲍姆等人也非常满意。他说道:“这次实验向人们传递了一个非常美妙的信息,那就是在贝叶斯理论的帮助下,人工智能不仅仅能做出被动式的概率计算和样本选择,还能针对样本进行更高级别的机器学习,并制作出新的样本。”
因此,贝叶斯理论的发现对于人工智能的自主化逻辑推理提供了强大的数字理论依据。从工作原理角度来说,贝叶斯推理可以极大限度地回避事件发生的偶然性与随机性,并利用数字概率的角度保障相关事物在发生、运行时应当遵循的客观规律。正如“抛硬币实验”,假如将一个硬币进行连续100次人为随机抛出,那么正反面向上的统计很可能距离“50:50”相去甚远;而如果使用以贝叶斯推理为理论基础的人工智能体来抛出,那么本次实验得到“50次正面向上且50次背面向上”的可能性就非常大了。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。