首页 理论教育 蜈蚣博弈悖论-有限次数博弈解析

蜈蚣博弈悖论-有限次数博弈解析

时间:2023-12-01 理论教育 版权反馈
【摘要】:“蜈蚣博弈”是由罗森塞尔在1981年提出的一个动态博弈问题。由于这个博弈的扩展形状很像一条蜈蚣,因此被称为“蜈蚣博弈”。人们在博弈中的真实行动偏离了运用逆推法关于博弈的理论预测,造成二者间的矛盾,这就是蜈蚣博弈的悖论。对于蜈蚣悖论,许多博弈专家都在寻求它的解答。

蜈蚣博弈悖论-有限次数博弈解析

蜈蚣博弈悖论:有限次数的博弈

“蜈蚣博弈悖论”,简称“蜈蚣博弈”或“蜈蚣悖论”,是在博弈论及博弈逻辑的研究中发现的悖论,是一种合理行为选择的悖论。“蜈蚣博弈”是由罗森塞尔(Rosenthal)在1981年提出的一个动态博弈问题。由于这个博弈的扩展形状很像一条蜈蚣,因此被称为“蜈蚣博弈”。

它是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。他们的博弈展开式如下:

在上图中,博弈从左到右进行,横向连杆代表合作策略,向下的连杆代表不合作策略。每个人下面对应的括号代表相应的人采取不合作策略,博弈结束后,各自的收益。括号内左边的数字代表A的收益,右边代表B的收益。如果一开始A就选择了不合作,则两人各得1个单位的收益;A如果选择合作,则轮到B选择。B如果选择不合作,则A收益为0,B的收益为3个单位;如果B选择合作,则博弈继续进行下去。

可以看到每次合作后总收益在不断增加,每增加一次合作总收益增加1,如第一个括号中总收益为1+1=2,第二个括号为0+3=3,第三个括号则为2+2=4。这样一直下去,直到最后两人都得到10的收益,总体效益最大。遗憾的是这个圆满结局很难达到。

大家注意,在上图中最后一步由B选择时,B选择合作的收益为10个单位,选择不合作的收益为11个单位。根据理性人假设,B将选择不合作,而这时A的收益仅为8个单位。A考虑到B在最后一步将选择不合作,因此他在前一步将选择不合作,因为这样他的收益为9个单位,比8个单位高。B也考虑到了这一点,所以他也要抢先一步采取不合作策略……如此推论下去,最后的结论是:在第一步A将选择不合作,此时各自的收益为1个单位,这个结论是令人悲伤的。

不难看出,在该博弈的推理过程中,运用的是逆推法。从逻辑推理来看,逆推法是严密的,但结论是不合理的。因为一开始就采取不合作的策略,A、B均只能获益1个单位,而采取合作的策略则有可能均获益10个单位。当然A一开始采取合作性策略有可能获得0,但1或者0与10相比实在是很小。直觉告诉我们采取“合作”策略是好的。

而从逻辑的角度看,A一开始应选择不合作的策略。人们在博弈中的真实行动偏离了运用逆推法关于博弈的理论预测,造成二者间的矛盾,这就是蜈蚣博弈的悖论。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验。实验发现,不会出现一开始选择不合作策略而双方获得收益1个单位的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方都这样做,要好于A一开始就采取不合作的策略。

倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略,而倒推法会在某一步起作用。只要倒推法起作用,合作便不能继续进行下去。

这个悖论在现实中的对应情形是:参与者可以确定在开始时不会采取不合作策略,但他难以确定在何处采取不合作策略。(www.xing528.com)

我们把这个模型用到实际中,看看会出现什么样的情况。现在我们创造出这样一种博弈(这个博弈在本书的后半部分还会有所变形):

两人分一笔总量固定的钱,比如100元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果不同意的话,两人将一无所得。比如A提方案,B表决。如果A提的方案是70:30,即A得70元,B得30元。如果B接受,则A得70元,B得30元;如果B不同意,则两人将什么都得不到。

A提方案时要猜测B的反应,A会这样想:根据理性人的假定,A无论提出什么方案给B,除了将所有100元留给自己而一点不留给B这样的极端情况,B都会接受,因为B接受了还有所得,而不接受将一无所获,当然此时A也将一无所获。此时理性的A的方案可以是:留给B一点点,比如1分钱,而将99.99元归为己有,这时的方案是:99.99∶0.01。B接受了还会有0.01元,而不接受,将什么也没有。

这是根据理性人的假定产生的结果,而实际上却不是这样。英国博弈论专家宾莫做了这个实验,发现提方案者倾向于提50∶50;而接受者会倾向于:如果给他的少于30%,他将拒绝;多于30%,则不拒绝。

这个博弈反映的是:“人是理性的”这样的假定在某些时候存在着与实际不符的情况。

我们说理性的人的选择是使自己的效益最大,如果信息不完全,则是使自己的期望效益最大。但这难以解释现实中人们购买彩票的现象。

人们愿意掏少量的钱去买彩票,如买福利彩票、体育彩票等,以博取高额的回报。在这个过程中,人们的选择理性发挥不出来,而惟有靠运气。这个博弈中,人们要在购买彩票还是不买彩票之间进行选择。根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。

彩票的中奖率肯定低,并且命中率与命中所得相乘肯定低于购买的付出。因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们肯定赢。这时,彩票购买者是不理性的:他未使自己的期望效益最大。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假定是不符合实际情况的。

当然我们可以给出这样一个解释:现实中人的理性往往只关心高效用问题,而忽视低效用的问题。这就是所谓的“低效用区的决策陷阱”。在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,几乎为零,而所能命中的期望也几乎是零。这时候,影响人抉择的就是非理性的因素了。比如,考虑到如果自己运气好的话,就可以获得高回报,可以给自己带来更大的效用等等。彩票发行者正是利用了人们的“低效用区的决策陷阱”而赚钱获利。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈