首页 理论教育 图灵测试:科技塑造未来,机器通过测试

图灵测试:科技塑造未来,机器通过测试

时间:2023-07-24 理论教育 版权反馈
【摘要】:随后,他提出了一种思想,这就是今天的“图灵测试”。我们可以用一种现代的类比方法总结一下图灵测试:正在阅读此书的你自然是拥有智能的,试想你的脸书访客正邀你参与对话。图灵测试广受赞誉,主要是因为它简单、直观,容易理解。其实不用考虑太远的未来,即便今天也有些算法或计算机程序能够时不时地通过图灵测试。2011年印度科技节上,机灵机器人的最新版本接受了图灵测试。

图灵测试:科技塑造未来,机器通过测试

数学家艾伦·图灵(Alan Turing)生于20世纪初,被誉为当时最伟大的思想家之一。如果觉得言过其实,你可以去解一下,正是他的思想和理念为今天所有的计算机奠定了基础。如果说所有的哲学都是柏拉图哲学的注脚,那么也可以说所有的软件、硬件和计算机科学创新都是图灵思想的注脚。

不知道图灵有没有意识到他对计算机技术发展会有多么深远的影响。阅读他的著作,你会发现他曾提出过这样一种可能性:有朝一日,人们将开发一种先进的机器,这种机器拥有人类一样的智慧水平。他对这样的未来非常感兴趣。图灵曾想:“我们怎么知道一台机器是否真的智能呢?”随后,他提出了一种思想,这就是今天的“图灵测试”。

我们可以用一种现代的类比方法总结一下图灵测试:正在阅读此书的你自然是拥有智能的,试想你的脸书访客正邀你参与对话。你怀疑对方可能是个机器人,是个伪装成人的电脑程序。它只是想赢得你的信任,以后再找机会推销东西。但是,你怎么才能确定呢?你可能会试着跟对方聊天,问一些只有真正的人类才能给出正确答案的问题,这样不断挑战对方,直到对方露出真面目。这就是图灵测试。假如访客通过测试,你也相信对方是一个有血有肉的人,而不是计算机,那么图灵就认为,这台计算机或者它应用的软件在对人类语音或打字输入及输出的模拟已经达到足够高的水平,至少外在表达方面已达到足够高的水平。

图灵测试广受赞誉,主要是因为它简单、直观,容易理解。不过,它虽然很简单——或许正因为它很简单——它没有真的测试计算机的智能水平或者它与人类智能的相似程度。人的一生会有各种各样的感受和见解,要开发能像人一样思考的计算机,我们还有很长的路要走。话虽如此,再过几年,我们还是有希望创造一种具有人类基本智能的计算机软件。

问题来了:还要多久呢?如果我们真的做到了,这种软件会给我们和我们下一代的生活带来什么改变呢?

其实不用考虑太远的未来,即便今天也有些算法或计算机程序能够时不时地通过图灵测试。机灵机器人(Cleverbot)就是其中之一。不过,它虽然很成功,但还远没有拥有真正的智能或者人类的思维能力。原因可能在于它的会话技巧是从普通的“键盘侠”那儿学来的。

机灵机器人是在1997年前被上传到网上的,它从那时起就可以跟那些寻找片刻消遣的访客随意交谈。该算法将访客回答的句子储存起来,变成机灵机器人会“说”的话,然后在与其他访客对话时用来回应类似的句子。这是一种非常简单的对话方式,但是机灵机器人每天大约要进行10万次这样的谈话,积累了大量不同的句子。

2011年印度科技节上,机灵机器人的最新版本接受了图灵测试。30名志愿者和该算法进行了30次对话(每次持续4分钟),并由100人投票,观众对每个使用者的表现打分。计票结果显示,机灵机器人有59%的回应被认为是人类行为。相比之下,只有63%的人类反应被认为是人类行为。最近还有一个聊天机器人成功假扮成一个13岁的乌克兰男孩,而且它还有一种古怪的幽默感,可以用玩笑来转移一些难接的话题。

当然,不管是机灵机器人还是其他聊天机器人,都不具备真正的智能,也无法像人类一样思考。不管怎样,就像刮胡子的时候,浴室里的镜子只能反映出你的脸而已。未来可能会有极其先进的镜子会投射出你脸部的不同角度,让剃须更顺畅。甚至可能会有能投射3D影像的镜子,但是它都只能反映发生在它之外的、正在别处发生的过程。装置内部显然没有一个与我相同的大脑。机灵机器人也是这样的,因为它无法分析和处理数据或新情况,也无法做出自己的反应。比如说,它就永远无法取代实验室的研究人员,开发实物模型。如果所有人类都以机灵机器人的方式思考,那科技界会完全满足于现状,止步不前,一遍又一遍地复制相同的思想,不求改变,也不求进步。

悲观主义者会说一些人类在大部分时间里行为举止本就与这种不求进步的情况非常相似——这倒也不无道理。人类会从多年来学到的或者记住的行为模式中选择一种,然后照此行动,即便完全不合时宜,也不知改动。这当然有些夸大其词。人类天生就会分析新情况,并以此为基础,努力调整自己。问题是:是否有可能开发一种能构建广泛的真实世界知识库,并据此做出反应的计算机呢?

这确实是个大问题。2011年,IBM研发的计算机沃森(Watson)打败了《危险边缘》(Jeopardy!)节目史上胜率最高的两位人类选手,赢得了一百万美元。这说明,它可以“理解”自然说出(写出)的问题,那些从前只有人类才能成功回答的问题。这些都是来自阅读书籍、在线百科全书数据库,再加上提炼各种关联和见解实现的。(www.xing528.com)

《危险边缘》并不是普通的冷门知识小游戏。问题的作者总是竭尽所能创造复杂的谜题。而且,这个问答节目中的大多数问题甚至都不是以问题的形式提出的,用的是描述性或者陈述性的句子,选手们需要自己去弄清楚问题究竟是什么。

比如说,在一个普通的问答游戏中,我们可能会遇到这样的问题:“丘吉尔的出生地是哪里?”虽然可能很多人答不出来,但这个问题本身简单明了。《危险边缘》节目上的问题更像是两个人在不经意的对话中出现的句子。节目中可能出现这样的问题:“爱因斯坦看到这个英国小镇上的宏伟宫殿时,很受触动,于是送给丘吉尔一块小手表,让他铭记自己出生的地方。”主持人说这些话的时候是想知道什么呢?其实,就是前面那个简单明了的问题:“丘吉尔的出生地是哪里?”

人类当然会觉得从那段陈述中提取出问题相对容易,但对计算机而言则并非易事。沃森计算机的开发人员并没有试图让它能真正理解(至少是我们所定义的“理解”)什么。相反,他们给沃森计算机输入了相当于大约100万本书的文本数量。沃森计算机把这些书中的段落拆分成句子,再把句子拆成单词和短语,并努力找出这些词之间反复出现的关联。这样,它就能了解到很多知识,比如船只可能会沉没,学生会有考试分数,人类探险家会在遥远的海滩登陆。利用这些词之间的关联,沃

① 美国的一档电视智力竞赛节目,该节目采取独特的问答形式:参赛者必须根据以答案形式提供的各种线索,以问题的形式做出正确的回答。——编者注。森计算机甚至能在三秒之内回答《危险边缘》中最难的问题。

为了更好地说明沃森计算机“思考”的方式,让我们来看一个例题:“1898年5月,葡萄牙庆祝哪位探险家到达印度400周年?”沃森计算机不会去理解这个问题,而是会把它拆分开。根据“400周年”一词,它会从1898减去400年,得到1498年。它查阅数据库,意识到这一年与很多历史事件相关,但是哪一个才是正确答案呢?“探险家”一词引起了它的注意。它查阅了探险家名单,并将其与1498年联系起来,就发现那一年达·伽马在印度的卡帕德海滩登陆。它继续研究“卡帕德海滩”这个词,发现这个地方经常跟印度联系在一起,而“印度”一词恰巧也在问题当中!所以,在这个过程的最后,沃森计算机回答的是“达·伽马是谁?”它回答问题不是通过理解问题,而是去它所读书中查找两个或两个以上单词之间联系出现的次数。这种复杂的算法运行于2800个IBM核心之上,利用15TB的内存,让沃森计算机能在三秒之内完成这些计算,并彻底击败了它的人类对手。

不过,沃森计算机也并不是万无一失的。节目中出现了一道很难的问题:“在1904年获得双杠金牌的美国体操运动员乔治·埃塞尔(George Eyser)的生理异常。”人类选手有些不知所措,回答说埃塞尔少了一只手。这是个严重错误,因为其实是少了一条腿。沃森计算机给出了更准确,也更糟糕的答案:“什么是腿?”而正确的答案应该是“什么是缺一条腿?”沃森计算机可能没找到“异常”的意思,所以才犯错的,因为这个词一般不会跟失去一条腿之类的意思联系在一起。对沃森计算机来说,正常的腿和缺失的腿没什么区别。两个词对它来说都一样陌生。确切地说,两个词对它来说都毫无意义,只是单词而已。

沃森计算机是智能的吗?具有自我意识吗?能像人类一样思考吗?总的来看,沃森计算机创建关联的过程可能跟人类思考的过程有些类似,将现实世界中的各种东西联系在一起。但是,沃森计算机无法独立思考或行动,它只能根据需要回答问题,而且需要预先在它内部设定好游戏规则,用来引导它选择最佳答案。

不过,沃森计算机确实是以一种独特的方式获得了基础知识——浏览人类的阅读材料。这是个不错的技能,但是就像前面说过的,它取决于针对特定目的的算法。在问答节目的案例中,这个目的就是在这个世界上最难的问答节目上在三秒钟之内给出问题的答案。为此,沃森计算机消耗了大量的计算资源,消耗了大量电力。简而言之,要满足那些只使用个人电脑或者手机的普通人的需求,还有很长的路要走。

但是,如果IBM或其他类似的软件和硬件公司成功地让沃森计算机可以为普通人提供服务会怎么样呢?

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈