首页 理论教育 一报还一报”的局限性与优化策略

一报还一报”的局限性与优化策略

时间:2023-05-16 理论教育 版权反馈
【摘要】:两轮比赛的结果都显示,胜出的是所有策略中最简单的一种,即“一报还一报”。但是,如果对局双方都遵循“一报还一报”的规则,即都对对方上一次的不合作予以一次报复,也可能导致对局陷入一个恶性循环,不再有回旋的余地。因此,研究者还推荐了一个更加宽容的策略,即不简单地对一次性的不合作行为进行报复,或者说是“两报还一报”的策略。

一报还一报”的局限性与优化策略

阿克塞尔罗德教授这项关于合作进化研究所采取的方法,是邀请各领域专家参加计算机竞赛,通过编程提出自己的对局策略,与其他参赛者的策略对局。两轮比赛的结果都显示,胜出的是所有策略中最简单的一种,即“一报还一报”(tit for tat)。这个策略既不像《圣经》中“以眼还眼”那样一味强调报复,也不像“有人打你的右脸,连左脸也转过来由他打”那样一味退让,而是孔子所说“以直报怨,以德报德”。也就是说,在对局中,第一步选择是采取合作的态度,随后则模仿对方上一步的选择。对竞赛结果的分析表明,在适当的条件下,从自身利益出发的博弈双方可以达成合作。

对竞赛数据的分析揭示了成功的博弈规则具有四个特征:第一,只要对方合作自己就合作,可以避免不必要的冲突;第二,面对对方的不合作行为要予以报复;第三,对不合作予以惩罚之后便采取宽容的态度,再度以合作试探;第四,行为要简单清晰,要让对方了解和适应自己的行为模式。此外,对研究结果进行归纳,特别是根据得分情况,还可以为行为者个体的选择提供几点建议,即:(1)不要妒忌对方的成功;(2)从不首先做出不合作的选择;(3)对合作和不合作都要做出迅速的反应;(4)不要耍小聪明。

但是,如果对局双方都遵循“一报还一报”的规则,即都对对方上一次的不合作予以一次报复,也可能导致对局陷入一个恶性循环,不再有回旋的余地。因此,研究者还推荐了一个更加宽容的策略,即不简单地对一次性的不合作行为进行报复,或者说是“两报还一报”的策略。得出的结论是,越宽容的策略最终获益越大,也可以表述为“有舍才有得”。(www.xing528.com)

这种重复的“囚徒博弈”并非完全机械被动的,而是可以通过由行为者做出三种改变来提高合作的可能性。第一,使未来相对于现在更加重要。譬如争取使对局双方的相互作用更持久、更频繁。第二,改变对行为者的四种可能结果的相对收益值。如利用某种国际规则让不合作受到的惩罚更重。第三,让行为者懂得更多的促进合作的准则、事实和技能。如制定一个可预期、有依据的对不合作的惩罚力度和反应速度,并明确展示给对方。

值得指出的是,美国现任总统特朗普本人的决策具有前所未有的随意性和不可预测性,他的贸易政策团队成员之间意见分歧也很明显,因此在贸易谈判中,他们未必信奉或者依据这里介绍的策略原则。不过,这种基于无限次数“囚徒难题”的博弈原理,仍然可以作为我们在应对贸易战中知己知彼的一个思考角度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈