两个示例：数据、模型与决策

时间：2023-08-12 理论教育版权反馈

【摘要】：根据以上信息,可以把孙悟空和猪八戒两人可能的策略和输赢列成矩阵形式,如图13.1所示。图13.1石头、剪刀、布从这个游戏可以看出,无论孙悟空和猪八戒出什么招,关键都在于他们对对手可能出什么招的“猜测”上。图13.2鸽派政策和鹰派政策图13.2表明,如果苏联和美国都采取鸽派政策,那么双方得到的利益为零,表示双方相安无事。

两个示例：数据、模型与决策

1.石头、剪刀、布

孙悟空和猪八戒护送唐僧去西天取经,一日来到火焰山,方圆百里酷热难当,孙悟空和猪八戒二人必须有一人去寻找淡水,否则唐僧师徒将命丧火焰山。但唐僧师徒经过长途跋涉已非常劳累,在火焰山找水更是难上加难,因而寻找淡水是份苦差事,孙悟空和猪八戒谁都不想承担这份工作,唐僧命令谁去都会引来“凭什么让我去”这样的诘问。一个较好的解决办法就是让唐僧当裁判,孙悟空和猪八戒通过“石头、剪刀、布”来决定胜负,谁输谁去寻找淡水。由于双方赢的概率一样,因此无论谁输,都输得心服口服(不存在耍赖这种情况)。游戏规则如下:孙悟空和猪八戒必须同时出招,谁后出算谁输;石头胜剪刀,剪刀胜布,布胜石头;如果一样,不算输也不算赢,重新来一次。例如,孙悟空出剪刀,猪八戒出布,则孙悟空赢;如果孙悟空和猪八戒都出剪刀,则重新开始游戏。根据以上信息,可以把孙悟空和猪八戒两人可能的策略和输赢列成矩阵形式,如图13.1所示。

图13.1　石头、剪刀、布

从这个游戏可以看出,无论孙悟空和猪八戒出什么招,关键都在于他们对对手可能出什么招的“猜测”上。如果孙悟空“猜测”猪八戒可能出石头,孙悟空的最优策略是出布,其他招都属不智;如果孙悟空“猜测”猪八戒可能出剪刀,孙悟空的最优策略是出石头,其他招都属不智;如果孙悟空“猜测”猪八戒可能出布,孙悟空的最优策略是出剪刀,其他招都属不智。同理,对猪八戒而言也是一样的。可以看到,孙悟空采取什么策略关键取决于猪八戒的策略,而猪八戒采取什么策略反过来又取决于孙悟空的策略。对这种情况正规的表述是孙悟空和猪八戒的策略具有相互依存性。

策略依存现象广泛存在于人类社会的方方面面,最极端的情景就是以命相搏的战争,这就是为什么博弈论思想最早产生于战争,并最早运用于战争。从这点(策略依存)来看,战争、阶级冲突、政治斗争、经济竞争甚至生物界的优胜劣汰都与游戏并无二致,这就是博弈论不仅被运用于经济学的研究,还被广泛运用于其他社会科学和自然科学的原因。

2.鸽派和鹰派

苏联和美国是冷战时期的两个超级军事大国,并长期处于对抗状态。从历史来看,苏联和美国很少出现公开的直接冲突,通常情况下,如果美国强硬,苏联就会采取暂时回避的策略,如果苏联强硬,美国就会主动回避。像古巴导弹危机那样的紧张局面极少出现,即使出现双方都会采取妥协的策略。苏联和美国之间的这种现象可以用一个简单的博弈模型来概括。显然,如果苏联和美国之间发生直接冲突,后果有可能是“同归于尽”,因此妥协比一味强硬结果要好。在政治术语中,鸽派通常代表妥协路线,而鹰派通常代表强硬路线。苏联和美国之间的博弈如图13.2所示。

图13.2　鸽派政策和鹰派政策

图13.2表明,如果苏联和美国都采取鸽派政策(避免冲突),那么双方得到的利益为零,表示双方相安无事。如果双方都采取鹰派政策,那么必然导致冲突的发生,后果是双方“同归于尽”,得到的利益为负的无穷大。如果一方采取鹰派政策,而另一方采取鸽派政策,那么实行鹰派政策的一方可威吓对方从而获得较多的利益,用“+1”表示,实行鸽派政策的一方则失去一部分利益,用“-1”表示。因此,苏联和美国到底采取什么政策,主要取决于彼此认为对方可能采取的政策。如果美国采取鸽派政策,那么苏联的最优反应是表现出强硬立场。如果美国采取鹰派政策,那么苏联的最优策略是退避三舍,采取鸽派政策。上述模型虽然简单,但却真实地反映了冷战时期的本质特征。在图13.2中,存在着两个博弈均衡解,它们分别是“苏联鸽派政策,美国鹰派政策”和“苏联鹰派政策,美国鸽派政策”,这就为冷战时期美苏两个超级大国主动避免冲突的行为提供了有说服力的解释。

通过以上说明,下面给出博弈论的一个非技术性定义。

博弈论用于研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,也就是当一个主体,如一个人或一个企业的选择受到其他人、其他企业选择的影响,并且反过来影响其他人、其他企业选择时的决策问题和均衡问题。从这个意义上说,博弈论又称为“对策论”。

从上述定义中可以看出,规定或定义一个博弈需要设定的基本概念包括:参与人、行动、局中人、战略、信息、支付函数、结果、均衡。

①参与人:博弈中选择行动以最大化自己效用的决策主体(可能是个人,也可能是团体,如国家、企业)。(www.xing528.com)

②行动:参与人的决策变量。

③局中人:在一场竞赛或博弈中,每一个有决策权的参与人都是局中人。只有两个局中人的博弈现象称为“两人博弈”,而局中人多于两个的博弈称为“多人博弈”。

④战略:参与人选择行动的规则。战略告诉参与人在什么时候选择什么行动(如“人不犯我,我不犯人;人若犯我,我必犯人”是一种战略,其中“犯”与“不犯”是两种不同的行动,战略规定了什么时候选择“犯”,什么时候选择“不犯”)。

⑤信息:指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。

⑥支付函数:参与人从博弈中获得的效用水平。支付函数是所有参与人战略或行动的函数,是每个参与人真正关心的部分。

⑦结果:博弈分析者感兴趣的要素集合。

⑧均衡:所有参与人的最优战略或行动的组合。

上述概念中参与人、行动、结果统称为博弈规则,博弈分析的目的是使用博弈规则决定均衡。

下面再用数学方式表示博弈的定义:

在一个n 人博弈的标准式表述中,参与者的战略空间为S1,S2,…,Sn,收益函数为u1,u2,…,un,用G={S1,S2,…,Sn;u1,u2,…,un}表示此博弈。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

研究成果

注意事项

解决方案

计算方法

发展趋势

中国古代

社会主义

心理健康

控制系统

经济发展

建筑工程

传统文化

民事诉讼

中国传统

程序设计

解决方法

轨道交通

工程施工

研究结果

建设工程

文史资料

持续发展

计算机网

使用方法

两个示例：数据、模型与决策

相关推荐

两个示例：数据、模型与决策

有关数据、模型与决策的文章

相关推荐