1944年,约翰·冯·诺依曼(John Von Neumann)与奥斯卡·摩根斯坦(Oskar Morgenstern)合著的《博弈论与经济行为》(Theory of Games and Economic Behavior)一书出版,他们在书中正式提出了合作博弈(Cooperative Game)的概念。由此开始,合作博弈理论得到了较快的发展,但主要研究的还是完全合作博弈理论。1960年,托马斯·谢林(Thomas Crombie Schelling)撰写的《冲突的战略》(The Strategy of Conflict)一书出版,他开创了不完全合作博弈理论研究,合作博弈理论研究从此走向成熟[35]。
完全合作博弈理论是以局中人完全参与合作为研究对象,通过对其各类解的研究,解决每类具体问题下的合作联盟、收益(或成本)分配等问题。完全合作博弈的解主要可以划分为集值解和单点解两类。
集值解是指可能包含不止一个解,主要是从防止联盟异议的角度考虑局中人的得益分配,主要包括核心、稳定集、谈判集等。核心(Core)最早由D.B.吉利斯(D.B.Gillies)于20 世纪50年代早期引进并被当作研究稳定集合的一个工具,罗伊德·夏普利(Lloyd Shapley)和马丁·舒彼克(Martin Shubik)将其发展为一个解的概念。在一个稳定的分配下,任何局中人组合都无意脱离总联盟,因为组成一个新联盟并不能使该局中人组合获取更大的得益,这些稳定的分配集合称为核心。核心不仅能满足个体理性和整体理性,而且能满足联盟理性,因此核心是一个凸闭集[36]。但核心的致命缺陷是解集经常是空的,即找不到一种能够被所有联盟都接受的得益分配方案。稳定集(Stable Set)是由约翰·冯·诺依曼和奥斯卡·摩根斯坦于1944年提出的。既是内部稳定又是外部稳定的分配集合称为稳定集。内部稳定性要求集内每一个分配都不会劣于集内的任何分配,外部稳定性要求集外的每一个分配都劣于集内的某些分配[36]。稳定集的存在性比核心要好些,但也并不总是存在,也可以是空的。谈判集(Bargaining Set)是由罗伯特·约翰·奥曼(Robert John Aumann)和迈克尔·马希勒(Michael Maschler)于1964年提出的。它是根据局中人之间可能出现的相互谈判而提出的解的概念,依赖于博弈的联盟结构,与核心和稳定集相比,其存在性可以得到保证,但计算过程复杂,可操作性不强[36]。
单点解是指只包含一个解,主要从边际贡献的角度考虑局中人的得益分配,主要包括夏普利值(Shapley Value)、班茨哈夫值(Banzhaf Value)、欧文值(Owen Value)等。对联盟的处理方式可以划分为两类:一是对所有联盟作对称处理,代表解是夏普利值、班茨哈夫值。夏普利值是由罗伊德·夏普利于1953年提出的,它从全部局中人是理性的假设出发,根据联盟中各局中人给联盟带来的边际贡献进行合理分配,使得集体理性与个体理性达到均衡[37]。夏普利值由于计算方法简单,存在唯一解,被广泛运用在经济社会发展的各个领域。Guillaume[38]提出了一种具有新的权重的夏普利值,并将权重解释为议价能力的措施。Tadeusz[39]讨论了加权夏普利值中局中人权重所起的作用,并赋予了一些新的特性。班茨哈夫值是约翰·班茨哈夫(John Banzhaf)于1965年提出的,有时也称Banzhaf 权力指标,是一种通过观察局中人左右摆动次数导致结果变化的数量来衡量局中人势力的指标。Gerard 等[40]将份额函数、联盟结构引入班茨哈夫值中,提出具有联盟结构的班茨哈夫份额函数,并对其性质作了研究。Dolors 等[41]提出班茨哈夫二项式半值并讨论了其具有的数学性质。班茨哈夫值主要被用于解决政治选举中权利的分配问题。Yakuba[42]针对政党选举问题分析评价了在限制联盟形成的情形下的班茨哈夫值。另一种对联盟的处理方式是考虑局中人优先联盟,代表解有欧文值。欧文值是由欧文(Owen)于1977年提出的。它对夏普利值进行的修改考虑了同盟系统,即由多个决定了事前合作结构的局中人集合分割存在时的变形,使其能够解释哪些联盟更能有效地参与谈判或协调[43]。Khmelnitskaya 和Yanovskaya[44]利用边际贡献性代替可加性和零元性对欧文值进行刻画。Albizuri[45]在不考虑有效性的情况下利用可加性、哑元性、匿名性等给出刻画欧文值的3 种方法。Vázquez-Brage 等[46]考虑当飞机是由不同的航空公司组织起来的博弈时,引入欧文值对西班牙Labacolla 机场的跑道成本分摊问题进行研究,结果发现一个航空集团的几个公司合并起来之后会节约成本分摊的支出。
总的说来,与集值解相比,单点解从局中人的边际贡献角度考虑分配问题,更能体现公平原则;在解释分配的原因和考虑优先联盟问题时,单点解也具有更强的解释能力。但是由于完全合作博弈理论并不能解释局中人不能完全参与合作而是部分参与合作的情形,因此需要将合作博弈理论的研究范围扩展至不完全合作博弈。
不完全合作博弈理论是针对局中人不是完全参与合作,而是以某种程度参与合作为研究对象,解决在此状态下的合作联盟、收益(或成本)分配等问题。不完全合作博弈可以分为两类,一类是冲突管理策略,另一类是模糊合作博弈。冲突管理策略认为冲突双方除了利益冲突之外,往往还存在某种共同利益,寻求双赢结果正是共同利益所在。托马斯·谢林认为,大多数冲突都存在讨价还价的可能,因此冲突一方能否达到目的取决于另一方的选择或决策的最佳平衡点[35]。奥宾(Aubin)于1974年首次提出模糊合作博弈(Cooperative Fuzzy Game)的概念。模糊合作博弈的解同样可以划分为集值解和单点解两类。集值解主要包括核心、稳定集等。单点解主要包括夏普利值、班茨哈夫值、欧文值等。单点解的研究重点主要集中在两方面:第一是仅参与度模糊的模糊合作博弈,也可称为具有模糊联盟的合作博弈,这类博弈中联盟是模糊集,收益是清晰的实数。Aubin[47-48]首先提出局中人可以以不同的参与率参加到多个联盟中,其参与率可以用一个介于[0,1]的模糊数来表示。Butnariu[49-53]定义了模糊夏普利值,并经研究发现模糊夏普利值与经典的夏普利值相比既不单调非减又不连续,并不能很好满足现实应用要求,之后他与Kroupa 一起研究了模糊联盟合作中一类更一般化的解即夏普利值映射。Tsurumi 等[54]构造了一个具有Choquet 积分的模糊夏普利值,使其满足既单调非减又连续。第二是仅具有模糊支付的模糊合作博弈,也可称为具有模糊联盟值的合作博弈,这类博弈中联盟是清晰集,收益是模糊数。Mares[55-59]指出带有模糊支付的合作博弈是模糊合作博弈的一种形式,但由此定义的模糊夏普利值无法满足夏普利提出的3 条公理,不能给出具体的联盟收益分配方案,仅可求得夏普利值的模糊隶属函数。Arts 等[60]从集合论的角度研究了模糊集合的夏普利值。(https://www.xing528.com)
上面关于合作博弈的论述主要是指静态合作博弈,而现实中的很多合作都是随着时间转变的决策互动。对于任何一个合作博弈,如果其中一位局中人在某时间点的行动依赖于在他之前的行动,那么该博弈便是动态合作博弈;反之则为静态合作博弈。如果有两个或两个以上的阶段,就是离散动态合作博弈;如果每个阶段的时间差收窄至最小极限,那么博弈便成为一个时间不间断的动态合作博弈,又称为微分合作博弈;如果在微分合作博弈中加入随机环境因素,则称为随机微分合作博弈[36]。Bilbao 等[61]提出动态夏普利值的解的概念,该动态模型的建立基于静态模型的递推序列。Albrechta 等[62]提出将夏普利值分解技术用于连续时间下的二氧化碳排放,它可以提供一个准确对称的分解且无残留。Bertinelli 等[63]运用微分博弈分析了相邻两个国家面对跨界CO2 排放的战略行为。
国内有关完全合作博弈理论的研究仍然可以划分为集值解和单点解两类。李军等[64]运用合作博弈理论研究了易腐性产品运输设施选择的费用分配问题,证明了在易腐性产品线性价值损失的情况下,运输设施选择博弈的核心非空,且为子模博弈,并讨论核仁、夏普利值、τ-值等解。李娟等[65]采用夏普利值分配供应链上的信息共享价值,制造商和零售商都有激励增加共享需求信息的零售商个数。张智勇等[66]建立了港口企业和其他物流服务提供商的合作博弈模型,讨论了用夏普利值法对港口物流服务供应链进行利益分配的不足,首次提出改进夏普利值即加权夏普利值在港口物流服务供应链利益分配中的应用。王艳等[67]把班茨哈夫值应用于效用可转移合作对策中的有限制对策,得到有限制对策的班茨哈夫值,同时给出公理化特征,并举例说明研究有限制对策的意义。梁晓等[68]研究了班茨哈夫权力指标的4 条性质,即有效性、哑元性、等价性和边缘贡献性,并利用这些性质刻画了班茨哈夫权力指标的唯一性,同时还通过一个实例说明了班茨哈夫权力指标在政治选举中权力分配的应用。李生伟[69]提出基于欧文值的输电损耗分摊办法,并与其他几种常用的输电损耗分摊办法进行比较,有力地证明了采用欧文值的输电损耗分摊办法的合理性和有效性。董保民和郭桂霞[70]运用合作博弈论中两个成本分摊工具——夏普利值和欧文值,采用厦门高崎机场2002—2005年的全年起降数据计算了机场起降费标准。孙红霞等[71]在具有联盟结构的合作博弈中,通过引入一种格结构,研究了各优先联盟以优先约束形式进行合作时的收益分配模型,并称这种博弈为具有联盟结构的限制合作博弈,称其解为限制欧文值。
不完全合作博弈主要包括两大类研究,一类是冲突管理策略。刘智勇等[72]通过构建群决策过程中决策群体的合作博弈模型,分析了群决策过程中的合作机理,提出了群决策冲突处理机制。另一类是模糊合作博弈,包括参与度模糊和支付函数模糊。陈雯等[73]利用模糊数学理论构造了模糊夏普利值,并将其运用在动态联盟企业收益分配中。孙红霞等[74]将合作博弈中的势函数和一致性运用到具有模糊联盟的合作博弈中,对具有模糊联盟博弈的夏普利值进行了刻画。谭春桥[75]利用Choquet 积分,研究了具有区间模糊联盟的合作对策,最后将其运用在供应链协作企业的收益分配实例中。李书金等[76]给出了模糊联盟的个体理性和集体理性定义,研究了模糊联盟的稳定性问题。彭智等[77]讨论了具有模糊支付的模糊合作对策中局中人间的相互影响问题。高璟等[78]针对现实中联盟组成的不确定性,提出了模糊联盟合作对策的一种新的收益分配方式,即平均分摊解。郭鹏等[79]在模糊博弈环境下,引入模糊变量的可信性测度,构建了模糊联盟收益分配的模糊期望值规划模型,并通过遗传算法求解。
国内关于动态合作博弈的研究相对较少,该研究主要包括动态合作博弈、微分合作博弈、随机微分合作博弈3 类。动态合作博弈方面,郑士源等[80]利用动态合作博弈对航空企业的竞争和联盟展开研究,并根据联盟达成均衡的过程找出了最稳定的结果。乔晗等[81]运用合作博弈分析和解决在动态决策进程中出现的合作方式发生变化的问题,通过引入新的特征函数和最优准则,建立了动态最优解PGN 向量,并给出了求最优路径和最优解的算法。王怡[82]通过对工业共生网络中的投机行为和风险进行分析,提出了工业共生网络战略联盟,构建了基于动态合作博弈的联盟收益分配模型,探讨了利润分配比例确定和不确定下联盟内企业的行为。微分博弈方面,马如飞等[83]构建了一个双寡头微分博弈模型,通过比较两家企业在研发竞争和研发合作下的企业瞬时收益,分析了技术溢出和技术更新是如何影响企业研发战略以及企业研发战略演化路径的。杨仕辉等[84]通过构建全球福利最大化下的两国微分博弈模型,深入分析了碳税、碳关税、碳减排合作3 种气候政策对全球福利和全球碳排放产生的环境效应。随机微分博弈方面,罗琰等[85]以保险公司为研究对象,分析了基于随机微分博弈的最优投资及再保险问题。张春红[86]针对资产定价存在不确定事件,提出了更符合实际的用资产价格模型反映市场环境的随机变化以及最优策略选择问题。朱怀念[87]利用动态优化理论中的极大值原理、动态规划原理等方法,系统研究了线性Markov 切换系统的非合作随机微分博弈理论,并给出了其在均值-方差型投资组合选择和保险公司投资-再保险中的应用分析。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
