首页 理论教育 博弈论的发展简史及分类的介绍

博弈论的发展简史及分类的介绍

时间:2023-04-06 理论教育 版权反馈
【摘要】:博弈论在为这些领域增添了新的研究工具的同时,也反过来促进了自身的进一步发展。博弈论发展的第二个里程碑应该是纳什的贡献了。他们两人的著作基本上奠定了当代非合作博弈论的基石。50年代中后期一直到70年代也是博弈论发展历史中产生重要理论成果的阶段。

博弈论的发展简史及分类的介绍

一、博弈论简史

博弈论的核心问题在于:如何在“策略互动”的局势中寻找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。因而博弈论可以简单地理解为研究策略互动局势中的局中人的理性行为的理论。

现在人们谈到博弈时泛指一切具有“策略互动”情形的行为活动。显然,“博弈”问题是人类不可避免的一类问题,广泛存在于军事政治经济领域以及人们的日常生活之中,这类问题的解决对于人类的生活具有非常重要的意义。人们对博弈的研究也有了很悠久的历史。其中不乏历史名著和经典的“博弈”故事。例如我国经典的军事名著《孙子兵法》,这部书虽然直接讲的是兵法,但大部分内容都涉及对“策略互动”局势的理性分析,孙子综合运用哲学心理学和逻辑分析等多种工具就军事中的“博弈”问题给出了比较客观的分析,较透彻地说明了军事冲突双方中的“博弈”关系,并给出了“局中人”应如何行事的建议,《孙子兵法》堪称“博弈”分析的古典典范。

在西方,公元前五世纪,《巴比伦法典》(Babylonian Talmud)(犹太人的道德、宗教信仰和民法的基础)中也曾经提到一个问题,这个问题就是婚姻契约问题:说的是一个男人有三位妻子,在他们的婚姻契约上详细规定了当他死去时,他的三位妻子将分别获得100,200,300的遗产。法典明确给出了很好的建议:当遗产只有100时,建议她们三人平均分配;当遗产为300时,相应的分配方案为(50,100, 150);如果遗产为200时,就按照(50,75,75)进行分配。这个问题一直困惑了研究法典的学者近两千多年,直到1985年,《巴比伦法典》才被公认为最早提出了现代合作博弈的理论。因为它的每一个解决方案完全地符合合作博弈的核心思想。

虽然在历史上(20世纪以前)曾有不少研究“博弈”问题的文献,而且就其内容来讲可以认为属于“博弈分析理论”或“博弈解释理论”,但就其方法而言,大多采用的或是哲学方法、或是心理分析方法、或是逻辑推理方法。

1944年冯·诺依曼和奥·摩根斯坦合作的《博弈论与经济行为》,标志着博弈论作为一门独立的学科的诞生。经过60多年的发展,博弈论已经渗透到军事、政治和经济等多种社会科学,以及统计、控制和组合等多种自然科学之中,特别是在经济博弈理论方面的应用取得了很大的成功。博弈论在为这些领域增添了新的研究工具的同时,也反过来促进了自身的进一步发展。

《博弈论与经济行为》出版时正是二战快结束之时,博弈理论由于其在军事应用上的价值,得到了军方的大力支持。由于冯·诺依曼本人对计算机的兴趣,使得他对博弈理论的关注主要集中在博弈问题的求解和计算方面。因而在20世纪40年代后期和50年代初期,博弈理论的发展主要集中在三个方面:第一个是极小极大值理论的不同方法的证明;第二个是在军事模型上的应用;第三个是和其他的数学分支发生联系。

博弈论发展的第二个里程碑应该是纳什的贡献了。纳什,美国数学家经济学家,他在1950和1951年发表了两篇关于非合作博弈的论文《n人博弈中的均衡点》和《非合作博弈》,定义了“纳什均衡”的概念,与Tucker于1950年定义的“囚徒困境”一起奠定了当代非合作博弈论的基石。而且正是基于这两篇论文,他和John Harsanyi和Reinhard Selten同时获得了诺贝尔经济学奖。而Harsanyi和Selten获奖的原因也是由于对博弈论的研究和应用作出了杰出的贡献,他们最重要的工作都是在纳什理论的基础上,发展了纳什均衡,并对纳什均衡的应用作了进一步的研究。

纳什均衡实际上指的是一个策略组合,在这个组合中,没有任何人有积极性偏离这种均衡的局面。虽然冯和摩根斯坦给出了博弈论的基本架构,但对于比较复杂的n人博弈(n≥3)的结构,他们没能够解决这一问题,而且他们关于任意对策都存在稳定集的猜想在1969年被另一位博弈论学者卢卡斯(W.Lucas)证明是错误的。从这个意义上来说,纳什的研究工作就具有特别重要的意义,它为博弈论提供了坚实的理论基础,是博弈论走向成熟的标志。

20世纪40年代末期到50年代中期是博弈论研究的第一个高潮时期。涌现出了很多博弈论大师,也可以说是博弈论巨人时期的到来。一方面是合作博弈在50年代发展到了鼎盛时期,这些包括纳什和夏普里(Shapley)在1953年的“讨价还价”模型,“Shapley”值的概念,Gillies和Shapley在1953年关于合作博弈中的“核”(core)的概念,以及其他一些人的贡献。另一方面是非合作博弈也开始创立,这主要应该归功于纳什在1950年和1951年所发表的两篇关于非合作博弈的重要文献,以及Tucker于1950年定义的“囚徒困境”。他们两人的著作基本上奠定了当代非合作博弈论的基石。奥曼(R.J.Aumann)认为,“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的翅膀,活跃着一批巨人”。

50年代中后期一直到70年代也是博弈论发展历史中产生重要理论成果的阶段。1954—1955年提出了“微分博弈”(Differential Games)的概念。奥曼则在1959年提出了“强均衡”(Strong Equilibrium)的概念。“重复博弈”(Repeated Games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“无名氏定理”(Folk Theorem)。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代出现的。

到了60年代后又出现了一些重要人物。其中泽尔腾(Reinhard Selten)在1965年提出了博弈方选择“相机计划”(Contingent Plans)的博弈中,不是所有的纳什均衡都是合理的,因为可能存在“不可置信的威胁”(Empty Threats)的问题,并提出了用“子博弈精炼纳什均衡”(Subgame Perfect Nash Equilibrium)对纳什均衡作精炼的思想。并将纳什均衡的概念引入动态分析,通过对纳什均衡在动态博弈、不完美信息和不完全信息博弈中的发展,后来又进一步提出了“精炼纳什均衡”、“精炼贝叶斯纳什均衡”和“颤抖的手的均衡”等一系列重要的概念;海萨尼(Harsa-nyi)在1967—1968年间的三篇论文则把不完全信息引入博弈论的研究,其主要贡献是提出了分析不完全信息博弈问题的标准方法,以及“贝叶斯纳什均衡”(Bayes-ian Nash Equilibrium)概念,这三篇论文后来成为现代经济学和博弈论中占极其重要地位的信息经济学的奠基石,可以认为他的不完全信息博弈理论是这一时期里程碑式的成果。海萨尼的主要贡献有:发展和应用贝叶斯决策理论;建立了不完全信息博弈的一般解法;用不完全信息重新解释了混合策略纳什均衡等等。

70年代博弈论发展中最重要的事件还包括“进化博弈论”(Evolutionary Game Theory)的发展,主要有John Maynard Smith在1972年引入了“进化稳定策略”(Evolutionary Stable Strategy,ESS)概念等。此外,“共同知识”(Common Knowl-edge)在博弈论中的重要性,也因为奥曼1976年的文章而引起了广泛的重视。

80、90年代是博弈论与主流经济学融合的时期,也是博弈论走向成熟的时期。在这个阶段博弈论的理论框架以及与其他学科之间的关系逐渐完整和清晰起来,博弈论在经济学中的应用领域越来越广泛,在经济学中的地位达到了一个高峰。这个时期最重要的进展包括Elon Kohlberg在1981年引入了“前向归纳法”(For-ward Induction),克瑞普斯(David M.Krepes)和威尔逊(Robert Wilson)在1982年提出了“序列均衡”(Sequential Equilibrim)的概念,斯密(John Maynard Smith)在1982年出版了《进化和博弈论》(Evolution and The Theory of Games),“可理性化性”(Rationalizability)概念由伯恩海姆(B.D.Bernheim)和皮尔斯(D.G.Pearce)提出,海萨尼和泽尔腾在1988年提出了有关非合作博弈中均衡选择的一般理论和标准,1991年弗德伯格(D.Fudenberg)和泰勒(J.Tirole)首先提出了“精炼贝叶斯均衡”(Perfect Bayesian Nash Equilibrium)概念。

在这个时期,博弈论开始受到经济学家的真正广泛的重视,并被看作为重要的经济理论和经济学的核心分析方法,开始贯穿几乎整个微观经济学、产业组织理论中,在环境、劳动、福利、国际经济学等学科中的地位也越来越重要。90年代中期两次诺贝尔奖的颁发加快了博弈论的发展。首先是前面所提到的纳什、海萨尼和泽尔腾在1994年获得的;另一个则是1996年的博弈论和信息经济学家莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)获得的,他们是由于在不对称信息条件下激励机制问题(实际上就是一种不完全信息的博弈问题)方面的基础性研究工作而获得的。

博弈论被引入到中国已经有了几十年的历史,从20世纪50年代我国学者就翻译了国外的部分博弈论著作并编写了一些相关的教材,逐渐地也产生了少量的论文和著作。一开始作为运筹学的一个分支。但博弈论在我国的传播、应用和研究一直都比较落后,关于博弈论的专著也是屈指可数。到了20世纪90年代中期,国内才陆续出版了一批比较全面介绍现代主流博弈论的教材和著作。最近十几年博弈论在我国的发展迅速,主要是由于我国改革开放以来,特别是实行市场经济以来,我国经济学界对博弈论的研究越来越重视了,博弈论也成为了目前国内最具有发展前途的学科之一。

二、博弈模型的分类

博弈的分类可以从三个角度进行。第一个角度是按照参与人行动的先后顺序进行分类。从这个角度,博弈可以划分为静态博弈和动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。

第二个角度是按照参与人对其他参与人的了解程度进行分类。从这个角度,博弈可以划分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、收益函数信息了解得不够准确或者不是对所有参与人的特征、收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

第三个角度是按照参与人之间是否合作进行分类。从这个角度,博弈可以划分为合作博弈和非合作博弈。合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行的博弈。反之,就是非合作博弈。典型的合作博弈是寡头企业之间的串谋。串谋是指企业之间通过公开或暗地里签订协议,对各自的价格或产量进行限制,以达到获取更多垄断利润的行为。根据非合作博弈在现代经济学中的地位和应用的普遍性,本书主要讨论非合作博弈。

根据上述分类,非合作博弈可以得到四种不同的类型:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应,有四种主要的均衡概念,即:纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。非合作博弈及对应的均衡概念见下表。

表1.4 博弈的分类及对应的均衡概念

博弈模型的均衡就是模型的解,用于预测参与人的策略,下面对各种模型的均衡作简要介绍。(www.xing528.com)

1.完全信息静态博弈的均衡

占优策略均衡:

占优策略是指这样一种特殊的博弈:某一参与人的策略可能并不依赖于其他参与人的策略选择。换句话说,无论其他参与人如何选择自己的策略,该参与人的最优策略选择是唯一的。在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡。

重复剔除的占优策略均衡:

在每个参与人都有占优策略的情况下,占优策略均衡是非常合乎逻辑的。但遗憾的是在绝大多数博弈中,占优策略均衡是不存在的。不过,在有些博弈中,我们仍然可以根据占优的逻辑找出均衡。

我们经常会按照“重复剔除严格劣策略”的逻辑思路进行。该思路可以归纳如下:首先找出某一参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下唯一的参与人策略组合为止,称为“重复剔除的占优策略均衡”。所谓“严格劣策略”是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中对自己严格不利的策略。

纳什均衡:

纳什均衡是指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。纳什均衡是完全信息静态博弈解的一般概念,构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略。许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,却存在纳什均衡。

占优策略均衡一定是纳什均衡。在重复剔除的占优策略均衡中,最后剩下的唯一策略组合,一定是在重复剔除严格劣策略过程中无法被剔除的策略组合。因此,重复剔除的占优策略均衡也一定是纳什均衡。

2.完全信息动态博弈的均衡

子博弈精炼纳什均衡:

子博弈精炼纳什均衡是泽尔腾于1965年首先提出的,其目的是将那些包含不可置信威胁的纳什均衡从均衡中剔除,从而给出动态博弈一个合理的均衡解。

所谓“子博弈”是指它本身可以作为一个独立的博弈进行分析,它是原博弈的一部分。而且,任何博弈本身可被称为自身的一个子博弈。

只有当某一策略组合在每一个子博弈(包括原博弈)上都构成一个纳什均衡,这一策略组合才是子博弈精炼纳什均衡解。显然,如果整个博弈是唯一的子博弈,纳什均衡与子博弈精炼纳什均衡是完全相同的。

3.不完全信息静态博弈的均衡

对于不完全信息静态博弈的均衡,海萨尼作了系统的分析,提出一种研究不完全信息博弈均衡的方法。按照海萨尼的方法,某一参与人的真实类型是给定的随机变量,其他参与人仍然不知道某一参与人的真实类型,但是知道可能出现的类型的概率分布。只要知道某一参与人的不同类型的概率分布,就将不确定条件下的选择转换为风险条件下的选择。这种转换称之为“海萨尼转换”。

通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈。在海萨尼转换的基础上,海萨尼提出了贝叶斯纳什均衡:在不完全信息静态博弈中,参与人的行动同时发生,没有先后顺序,因此,没有任何参与人能够有机会观察其他参与人的选择。在给定其他参与人策略的条件下,每个参与人的最优策略依赖于自己的类型。如果每个参与人虽然不知道其他参与人实际选择什么策略,但是,只要知道其他参与人有关类型的概率分布,他就能够正确地预测其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人选择的依据就是在给定自己的类型,以及其他参与人的类型与策略选择之间关系的条件下,使得自己的期望收益最大化。

4.不完全信息动态博弈的均衡

在不完全信息条件下,博弈的每一参与人知道其他参与人的类型的概率分布,但是,参与人并不知道其他参与人的真实类型。在不完全信息静态博弈中,我们通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的概率分布,计算博弈的贝叶斯纳什均衡解。而在不完全信息动态博弈中,由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的类型判断。

不完全信息动态博弈一开始,某一参与人就会根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。并根据这种不断变化的判断,选择自己最优的策略。这种不完全信息动态博弈的均衡过程,称为精炼贝叶斯均衡。

精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态博弈的贝叶斯纳什均衡的结合。贝叶斯方法是对有关特征的先验概率进行修正的标准方法。

在不完全信息动态博弈中,由于存在着依据信息对参与人类型判断的问题,均衡的计算依赖于参与人的信念体系。同一博弈,不同的信念体系会有不同的均衡。为了体现信念体系的理性要求,又提出了各种理性的标准对精炼贝叶斯均衡再精炼的均衡概念。在概念上显得花样繁多,但本质是对信念体系理性的强调。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈