以牙还牙以眼还眼明智吗?
以牙还牙明不明智,也许不能一概而论。不过,其中蕴藏着丰富的智慧。博弈双方均选择合作并一贯下去,当然相安无事,一旦一方背叛,另一方感情上倾向以牙还牙,从理智的角度来看,也需要采取以牙还牙的策略,因为这样会导致双方思考并建立利于合作的游戏规则,从而保证新的合作得以继续。
罗伯特·阿克塞尔罗德在其著作《合作的进化》中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
最佳确定性策略被认为是“以牙还牙”,这是阿纳托尔·拉波波特(Anatol Rapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。这个策略只不过是在重复博弈的开头合作,然后,采取你的对手前一回合的策略。更好些的策略是“宽恕地以牙还牙”。当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%-5%)时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时,“宽恕地以牙还牙”是最佳的。这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。在博弈中,“以牙还牙”是一个非常著名的策略,最广为人知的一点是这个策略能够促成高度的合作,不仅两个采取“以牙还牙”策略的玩家相遇时会出现稳定的合作,而且“以牙还牙”策略还能诱导或强迫采取其他策略的玩家也和它合作。
有一个有名的博弈论试验证实,无限博弈的纳什均衡是“以牙还牙,以眼还眼”策略,英文是“tit-for-tat”。也就是说一个人最优的与人相处的策略是,当别人对你好的时候,你就对他好;当别人欺负你的时候,你就欺负他;他永远对你好你就永远对他好;他永远欺负你就永远跟他对抗,直到他开始对你好。这个均衡是依据对很多人的试验得出的,也就是说人们普遍接受这样的相处规则,觉得只有这样大家在一起相处才会愉快,才会长久。(www.xing528.com)
“以牙还牙”是重复囚徒困境博弈时的最好策略。“以牙还牙”是一种和直觉不太一致的方法,在一对一时它没有胜过任何一种规则,因为它首先选择合作,然后复制对手的选择;它最后获胜是因为它总分最高,因为阴险规则相遇时会火拼,所以“以牙还牙”渔翁得利,靠敌人消灭敌人。如果我们留意生活的话,在日常生活中可以找到做到“以牙还牙”的人,他一定不是一个耍小聪明的人,而且他的原则性很强,熟知“人不犯我我不犯人,人若犯我我必犯人”理论。
“以牙还牙”策略有很多前提条件,如无限次重复,合适的权重。如果是有限次博弈,最优策略是“总是背叛”;如果背叛能带来百年一遇的好处,也会导致选择背叛。博弈论简直就是学术界的厚黑学,承诺和合同都只是一种策略,只要报酬够高而惩罚相比较不大,就导致选择背叛。只要缺乏监督或者相应惩罚,政府可以堂而皇之背叛老百姓,高官可以背叛组织纪律,基金经理可以背叛投资者,三鹿可以背叛良心,因为博弈论指出选择背叛时他们最优策略。
重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优。若干睿智而复杂的策略经过在计算机中PK之后,极其原始的“以牙换牙”策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必真正以牙还牙,第三方的规范——道德与法律将应运而生,并担当起我们的假牙,他们更加有利、有理、有节。
有大智慧的人,就要重新开始选择合作,并内心平气和地接受对方的背叛,如果对手选择合作,就要忘记以前被背叛时的愤怒,选择合作(需要好的心态)。切忌不要产生和对手同归于尽的心态,对手比我们多一点就多一点,我们是靠总体来取胜的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。