首页 理论教育 重复博弈与交往常态

重复博弈与交往常态

时间:2023-05-11 理论教育 版权反馈
【摘要】:重复博弈是交往常态重复博弈是指相同结构的博弈重复多次。影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。重复博弈的这个结果,为现实中的许多合作行为和社会规范提供了解释。重复博弈是动态博弈中的重要内容,这里田忌赛马重复了三次,有三个阶段。信用是在重复博弈中,当事人谋求长期利益最大化的手段。

重复博弈与交往常态

重复博弈是交往常态

重复博弈是指相同结构的博弈重复多次。其最大贡献是对人们之间的合作行为提供了理性解释;而在囚徒困境中,一次博弈的唯一均衡就是不合作。但是如果博弈无限重复,合作就可能出现,这样就对参与多次的重复博弈的双方的个人信誉问题提出了要求。

重复博弈是一种特殊的博弈,是指在博弈中,相同结构的博弈重复多次,甚至无限次。其中,每次博弈称为“阶段博弈”。在每个阶段博弈中,参与人可能同时行动,也可能不同时行动。因为其他参与人过去的行动的历史是可以观测的,因此在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。

“日久见人心”就是一句有关重复博弈的典型诠释,它是指日子长了,就可以看出一个人的为人怎样。 其出处为宋朝的陈元靓所写的《事林广记》卷九:“路遥知马力,事久见人心。”为什么日久就会见人心呢?这是因为,日子长了,人们间的博弈的次数多了,掌握着关于对方的为人等方面的越来越多的信息,就会对对方逐渐的了解和熟悉起来,从而就“见人心”了。因而,日久见人心所反映的经济学原理是重复博弈可以减少信息的不对称性,从而带来一种博弈双方间的均衡。

重复博弈具有三个基本特征:

A、重复博弈的阶段,博弈之间没有“物质”上的联系,即前一个阶段博弈并不改变后一个阶段的博弈的结构;

B、在重复博弈的每一个阶段,所有参与人都观测到该博弈过去的历史;

C、参与人的总收益是所有阶段博弈的收益的贴现值之和或加权平均数。

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。在重复博弈中,参与人存在着短期利益和长远利益的均衡,有可能为了长远利益牺牲短期利益而选择不同的均衡策略。重复博弈的这个结果,为现实中的许多合作行为和社会规范提供了解释。信息的完备性之所以影响均衡结果,是因为如果每一个参与人的特征不为其他参与人所知时,该参与人就很有可能积极建立一个好声誉,以换取长远利益。

田忌赛马是我们现在耳熟能详的故事,讲述了战国时期齐国大将田纪与君主赛马的故事。“下驷对其上驷,上驷对其中驷,中驷对其下驷”的策略让原本处于资源劣势的田纪赢得了比赛。

价值不会无缘无故的流失,赛马过程中田忌一定拥有马之外的其他生产要素。博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。从这点来看,好像这并不属于博弈,因为明显的齐威王比起田忌来就是个傻子。(www.xing528.com)

田忌坑害齐威王的规则是这样的:齐威王三次都是自己先出马,这就形成了信息上的不对称,田忌获得了更多的信息。所以这属于一种不完全信息的博弈。首先列出完全信息的定义:在信息对于双方来说是完全公开的情况下,双方可以同时或不同时做出决策,但做出了怎样的决策在对方做决策前不为对方所知。其实在“田忌赛马”的过程里,对于完全信息的前半部的定义:信息对于双方来说是完全公开的情况下,双方都是获知的,如果田忌连怎么分辨上驷下驷中驷的知识都没掌握,那他之后的策略完全没有意义。信息不对称产生的原因是田纪的决策永远在齐威王之后,而且永远是获知齐威王决策后再进行决策的。

如果双方在完全信息下博弈,那这个事件就完全只是几个概率,赛马的对阵情形种类N=3*2*1*3*2*1=36,田忌能获胜的次数为M =3*2*1+3*2=12,则田忌获胜概率为1/3,齐威王2/3。,在这种情况下,这样我们能说在概率空间里投资大的永远比投资小的获益高。

另外田忌赛马属于重复博弈,重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,这里田忌赛马重复了三次,有三个阶段。其实我更倾向于把它当作是两次,因为第三次根本就没有信息流动,关于这点我会在下面的段落里重点解释。

当然,赛马双方是田忌和齐威王,不存在第三者,所以我把田纪赛马归类于双方不完全信息重复博弈。

如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,那么参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;而在囚徒困境中,一次博弈的唯一均衡就是不合作。但是如果博弈无限重复,合作就可能出现,这样就对参与多次的重复博弈的双方的个人信誉问题提出了要求。在日常的交往中,田忌赛马故事比比皆是,我们必须采用这一博弈策略保持自己良好的心态,增加自信,并且能够运用它来在自己总体优势处于下风时也能取得自己的胜利!

重复博弈中的无名氏定理说明,对于相同的个体进行无限次重复博弈,如果参与人具有足够的耐心,则互利的合作均衡可以作为子博弈精炼均衡出现。也就是说,只要交易具有长期性,且交易双方对未来收益的贴现足够高,则双方将从长远利益出发维持相互的合作。交易反复进行则容易建立信用关系,因为合作的长期利益远远大于失信获取的短期利益。信用是在重复博弈中,当事人谋求长期利益最大化的手段。若博弈重复发生,则人们会更倾向于相互信任。

理性行为并不导致社会最优结果,如果交易只进行一次那么市场中便会出现大量互相欺骗的行为,诚信不可能产生。但当交易扩展到无数次之后,合作解便得以出现。只要博弈时间足够长,由于对未来收益的预期,自利的个人,会自愿的选择诚信而不愿意去进行欺诈,从而诚信和作为道德的合作机制能得以产生。

在明代的贵州,乡村的市集并不像今天的超市、便利店一样,24小时进行营业非常便利。而是每个月只交易数次,比如王阳明被流放的地方叫“龙峰”,这个地方便选择传统十二生肖中的“龙日”进行交易,每个月只交易2到3次。但是,由于市场范围很小,交易只进行少数农产品,从事商人这种职业的人数极少。不仅所有村庄的人都认识这些商人,而且这些商人都是子承父业,交易可以被看成世代相传的无限次博弈。由于每个博弈者都考虑到未来的收益而不愿意进行欺诈性的行为以损害未来的收益,从而无限次博弈的合作解会出现,这便解释了传统社会中,作为价值伦理的诚信和儒家教义的重合性,因为诚信是好的而且是诚信是符合博弈的合作解。如果时间不足够长,或者贴现因子太小时候,合作共谋便不成立。比如末世危机时所表现出来的短期行为。

诚信是重复博弈的结果诚信,并非人们自觉自愿的选择,而是出自自身利益的需要,是人们在交易中重复博弈的结果。有人发现,在一个相对封闭的小乡村,人们守信的程度和履约的能力相对较高。为什么?因为大家生活在一起,谁守信,谁不守信,信息的识别和传递相对较快。如果有人信誉不好,大家很快就知道了,那么这个人在这个村庄里就很难获得其他人的信任,他可能因为失信而中断同村庄其他人的交易,受到应有的“惩罚”。这对不守信的人是非常不利的,他不仅丧失了许多交易的机会,而且个人的名声以及对整个家庭甚至后代都会受到损害。一个老农民临终前叫来儿子,告诉他欠邻居的钱没有还,要儿子替他还债,儿子不得不还,因为父债子还是讲诚信的表现,如果儿子不替父亲还债,那样他的家庭就会失信于人。所以,在一个相对封闭的社会,由于受到交易范围的局限,人们需要在这个狭小的范围内反复打交道,出于自身利益的考虑,往往会选择守信。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈