【摘要】:博弈论中著名的“囚徒难题”讲的是:两个彼此没有沟通机会的犯罪嫌疑人,在“认罪”或“抵赖”之间进行选择,虽然分别都是从各自的利益出发,最终却由于两个人之间的不合作,终究不能选择最适宜策略,从而导致两败俱伤。此外,这项研究还必须保持“囚徒难题”基本形式不变,唯其如此才能在同一框架下找出合作的必要条件和充分条件,回答什么是最适宜策略的问题。
博弈论中著名的“囚徒难题”讲的是:两个彼此没有沟通机会的犯罪嫌疑人,在“认罪”或“抵赖”之间进行选择,虽然分别都是从各自的利益出发,最终却由于两个人之间的不合作,终究不能选择最适宜策略,从而导致两败俱伤。
我们可以把这个“囚徒抉择”的例子改写为两个行为者甲和乙,各自在“合作”与“不合作”之间进行选择的情形。如图所示,两个人的行为可组合成四种情形,分别可以得到不同的分值,即R——对双方都合作的奖励,T——不合作的诱惑,S——单方合作或“蠢行”的损失,P——对双方都不合作的惩罚。在这个一次性博弈中,如果不知道对方会做出怎样的选择,双方都从理性出发选择不合作,最终结果却比双方合作的得分要少。这就是难题所在。(www.xing528.com)
把这个博弈重复做下去,结果则可能不同,即可能出现双方合作的情形。需要指出的是,这里讲的重复博弈,不是行为者可以预知博弈次数的多次博弈,而是行为者不知道何时结束的无限次博弈。这样才能使今天的策略选择既受当前情况的影响,也受到未来结果的影响,并且任何一方的策略历史都可以成为对手决策时的参考。此外,这项研究还必须保持“囚徒难题”基本形式不变,唯其如此才能在同一框架下找出合作的必要条件和充分条件,回答什么是最适宜策略的问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。