纳什均衡法则
阿蒋和小姬是一对正泡在蜜月中的小两口,周六到了,安排什么节目好呢?周六晚上,中国足球队要在世界杯小组赛中和巴西队比赛。阿蒋天生就是个超级球迷,国内的甲级联赛他从不肯放过,何况是国家队和心目中的偶像巴西队的比赛?
无巧不成书,也正好是这个周六的晚上,俄罗斯一个著名芭蕾舞剧团莅临该市演出芭蕾舞剧《胡桃夹子》。而小姬非常喜欢钢琴、芭蕾这样的高雅艺术,对俄罗斯的歌剧和芭蕾更是崇拜得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧呢?
怎么办?其实这事也不难解决:一个在自己家里看电视转播的足球赛,一个去剧院看芭蕾舞演出。但是,问题在于他们是热恋中的情侣,分开度过难得的周六,是他们最不乐意的事情。这样一来,他们真是面临了一场“博弈”。
我们不妨这样给阿蒋和小姬的“满意程度”赋值:如果阿蒋看球,让小姬一个人去看芭蕾,双方的满意度都为0;若是两个人一起去看足球,阿蒋的满意度为2,小姬的满意度1;两个人一起去看芭蕾,阿蒋的满意程度为1.小姬的满意程度为2;应该不会有小姬独自看球而阿蒋独自去看芭蕾的可能,不过,人们还是把这写出来,设想双方的满意程度都是-1。
在这个博弈中,双方之间不存在“囚徒困境”中那样的最佳策略,但是他们总会做出一个较好的选择,因他们是蜜月中的夫妻。因此面对的是一种策略优势不那么明显的博弈,而这种博弈的结局,恰恰是纳什均衡研究的对象。
策略优势不明显,指的是双方都没有“不论对方采取什么策略,我采取这个策略总比采取任何别的策略更好”的严格优势策略,因此,他们只需寻找一种双方“相对优势策略”的组合。双方都去看足球,或者双方都去看芭蕾。就是我们所说的相对优势策略的组合,一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。
比方说两人一起看足球,阿蒋得2,小姬得1。如果阿蒋改变主意单独去看足球,变成双方都得0,没有好处;如果小姬改变主意单独去看芭蕾,也变成双方都是0,也没有好处,所以两人一起去看足球是稳定的结局。同样,两人去看芭蕾也是稳定的结局。
这种稳定的结局就是“纳什均衡”,在情侣博弈中,双方都去看足球,或者双方都去看芭蕾,是博弈的两个纳什均衡。形象地说,纳什均衡实际上就是一种“僵局”,给定别人不改变策略的情况下,没有人有兴趣单独改变策略,而且,这种单独改变不会给他们带来好处。
在这种博弈中,如果一方知道了对方的策略以后,就可以做出对自己最有利的选择。因此,保证策略的随机性是十分必要的。
这个概念是由普林斯顿大学数学家约翰·纳什于1950年建立的。由于对博弈论做出奠基性的贡献,他在1984年荣获诺贝尔经济学奖。
如果用科学的语言来描述纳什均衡,指的是在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
听起来很拗口,而且难以理解,但却是不折不扣的科学,而且备受经济学家们的青睐。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。
某个小镇上只有一名警察,他要负责整个镇的治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。(www.xing528.com)
假定银行需要保护的财产价格为2万元,酒馆的财产价格为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,就会被警察抓住;若警察没有巡逻的地方而小偷去了,则小偷偷盗成功。那么,警察怎么巡逻才能使效果最好?
一个明显可取的做法是,警察权衡轻重,只对银行进行巡逻。这样,警察可以保住2万元的财产不被偷窃。可是如此,假如小偷去了酒馆,偷窃一定成功。
这种做法是警察的最好做法吗?有没有对这种策略改进的措施?
在纳什均衡被发现之前,也许没有别的答案。但是纳什均衡为我们开辟一个观察问题的新视角。
对于这个例子,虽然没有纯策略纳什均衡点,也就是参与者在他的策略空间中选取唯一确定的策略。但是却存在混合策略均衡点,在这个混合策略均衡点下,参与者的策略选择是他们的最优(混合)策略选择。
这样,对于警察的一个最好的做法是,警察抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍,所以用两个签代表银行,比如抽到1、2号签去银行,抽到3号签去酒馆。这样警察有2/3的机会去银行进行巡逻,1/3的机会去酒馆。
而小偷的最优选择是:以同样抽签的办法决定去银行还是去酒馆偷盗,只是抽到1、2号签去酒馆,抽到3号签去银行,那么,小偷有1/3的机会去银行,2/3的机会去酒馆。
而且,他们的策略都应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果一方知道对方其中一个策略的“可能性”大,那么就能做出对自己最有利的决定,赢的可能性就会大。
就单次情侣博弈而言,存在着两个“纳什均衡”:或者一起看球,或者一起看芭蕾。但是,最后结局究竟落实到哪一种情形,却是博弈论本身尚未解决的问题。
我们可以根据经验来分析,在更多情况下,结果还会体现先动优势,虽然双方都会得好处,但是先行动的一方得益多一些。我国古代已有“先下手为强”的说法。大量例子说明,在有多个“纳什均衡”的情况下,常常是先动手的一方会占一些优势。
在这里,由于决策或行动有了先后次序,所以叫做“动态博弈”。比方说。两人还没商量,小姬就打电话告诉阿蒋:我已经买了票,周六一起去看芭蕾,好吗?
况且他们是恋人,小姬已经开口说了,阿蒋还会驳她的面子吗?如果我们觉得没经过商量就先买了票有点过分,那么就可以把情况改为小姬打电话给阿蒋,建议一起去看芭蕾,得到同意才去买票。我们可以设想,阿蒋接到小姬的电话,也不会驳她的面子。而使双方最终得到满意的结局。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。