首页 理论教育 破解囚徒困境:数据、模型与决策

破解囚徒困境:数据、模型与决策

时间:2023-08-12 理论教育 版权反馈
【摘要】:在市场经济环境下,这种“囚徒困境”的例子随处可见,为了解开囚徒困境,达到帕累托最优,可以尝试如下改进策略。采用二元收益模型:囚徒困境中将关押时间作为唯一影响决策的变量,可以考虑增加一个变量——经济利益。当这种奖励或惩罚达到一定程度时,双方都会选择“不坦白”这一策略,在现实生活中经常会看到这种现象。

破解囚徒困境:数据、模型与决策

在市场经济环境下,这种“囚徒困境”的例子随处可见,为了解开囚徒困境,达到帕累托最优,可以尝试如下改进策略。

合作:将两囚徒的不合作博弈变为合作博弈。如果双方了解得足够,并且合作关系比较牢固,深知对方在任何情况下都不会出卖自己,而且自己也愿意为双方的整体利益承担更大的风险,这时,两人都会选择“不坦白”,从而达到帕累托改进的效果。

采用二元收益模型:囚徒困境中将关押时间作为唯一影响决策变量,可以考虑增加一个变量——经济利益。在合作的情况下,双方的经济利益将得到最大保障,这时,收益函数变为二元的,从而改变了原来的收益矩阵

变一次性博弈为重复性博弈:当博弈进行多次,并且双方都很清楚地知道还有多次博弈时,双方就会采取合作的态度。当然,如果是有限次博弈,我们不清楚双方将于何时改变合作的态度,变为不合作博弈。当博弈次数不定时,实验结果表明,对博弈者最有利的策略是简单的“针锋相对”策略,即第一回合采取合作策略,后面则视对方策略而改变。如果对方合作,则在下一回合中合作;如果对方背叛,则在下一回合中背叛。(www.xing528.com)

加上赏罚因素:这与道德的形成类似,如果有一个外部监督机制,对采取合作的囚徒给予奖励,对不合作而坦白的囚徒给予惩罚,就能够有效改变收益矩阵的数值。当这种奖励或惩罚达到一定程度时,双方都会选择“不坦白”这一策略,在现实生活中经常会看到这种现象。在社会制度或道德的制约下,企业约束自己的行为从而达到合作博弈的结果。

双方之间能够进行沟通显然是一个改变双方纳什均衡策略的机会,但沟通的结果能否实现还要取决于双方的信任程度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈