制度与行为
张旭昆
作者简介:张旭昆(1953— ),男,江西于都人,教授,浙江大学经济研究所所长,宁波大学商学院院长。
行为主体的博弈策略集是制度的函数。制度决定了不同行为主体的不同策略集。当制度不同时,行为主体的博弈策略集也将不同。制度决定了人们行为的博弈策略集,但并未直接决定人们的具体行为,决定人们在博弈策略集中选择何种行为的是人们的目标集及其所面临的特定局势。
每个主体在特定时点总归会有一个目标集合。目标集包含各种目标及其期待值。可以把主体的各种目标分成制度目标和局势目标。前者表明主体需要什么样的制度,后者表明主体在一定制度下希望出现什么样的局势。主体所选择的目标的种类取决于他的价值观念和知识素养,从而受到文化传统、知识存量等因素的影响。目标的期待值取决于主体对博弈结果的预期,这取决于他的知识和经验。目标期待值有的可量化为某一具体数值,有的则难以量化,只有实现与未实现之分。前一类目标期待值可以用边际分析方法求解,后一类目标期待值只有角点解。
目标集通过支配人们的行为影响社会的经济绩效,当这种客观的经济绩效与人们主观的目标相吻合时,制度将趋于稳定;当这种客观的经济绩效与人们主观的目标不相吻合时,在长期中制度将趋于变化。当然制度又会影响文化传统和知识存量的稳定或变化。
从博弈论的角度来看,特定局势便是在既定制度下各个主体采取一定行为后所达到的博弈结果。它并非消极地反映人们在既定制度下的行为,也反过来影响到人们的行为。人们的行为虽然在范围上受到制度的约束,但在制度允许的范围内,经常随特定局势的变化而变化。
主体根据自己的目标集合和所面临的特定局势,在现行制度所决定的可行空间中选择最有利于自己的行为。可以把这种行为称作遵从现行制度时的最佳行为。当所有主体都采取各自的最佳行为时所导致的特定局势,就是博弈的解。在这种局势中主体所处的境况,可称作他的最佳境况。
由于在既定制度下博弈的解可能并非唯一。因此主体可能具有若干个最佳境况,它们组成既定制度下个人的最佳境况集合。显然,主体的最佳境况集合是制度的函数。当主体在特定制度下的最佳境况集合符合其目标集合时,主体将采取遵从现行制度的行为,简称守制度行为。当主体在特定制度下的最佳境况集合不符合其目标集合时,他有以下三种选择[1]:一、在制度许可的范围内调整其行为,使其最佳化;二、调整其目标集,消除不合适的目标种类或降低目标的期待值;三、采取不遵从现行制度的行为,即现行制度未置可否的行为和现行制度所排斥的行为,可简称之为非制度行为。非制度行为是可能(但不一定)引发制度变迁(博弈的策略集变化)的行为。上述三种选择首先采取哪一种,取决于三者的预期净收益比较。主体通过在遵从现存制度条件下的最佳行为,追求现行制度下的最佳境况;通过非制度行为,追求主体的最佳境况集与主体的目标集最吻合的制度。美国经济学家布罗姆利把市场经济中的前一种行为称作商品交易,把后一种行为称作制度交易[2]。
主体是否采取非制度行为,通过博弈论模型可加以说明。这里需要区分两类博弈,一类博弈是两个地位平等的主体(即谁也不须也不必听命于谁)之间的博弈,另一类是同一组织内两个地位不平等的主体(如领导与被领导,上司与下级,等等)之间的博弈。
首先分析第一类博弈,假定两个主体都可采取两种策略:遵守某项制度(a)或不遵守(n)。假定矩阵是对称的,如下图所示:
由于是对称矩阵,下述关系总是成立:b11A=b11B,b22A=b22B,b12A=b21B,b21A=b12B。因此只需考虑b11Ab12Ab21Ab22A之间的各种可能的大小和相等关系。设b11Ab12Ab21Ab22A的取值范围是4,3,2,1,0。下面重点考虑如下几种关系:
(1)b11A=b12A=b21A=b22A,设为:
这时,A和B两主体随便采取任何一种策略,其结果都一样,这意味着任何一个主体的行为都不影响另一个主体,即不存在外部性。
(2)b11A=b22A>b12A,b21A,设为:
这时,A和B两主体必须采取统一行动,或者都遵守制度,或者都不遵守制度,才有比不采取统一行动更大的收益。但统一采取哪一种行为,则博弈本身无法解决。这是纯合作博弈。双方的协商有助于更快地从非均衡境况走向均衡境况。如果两种均衡状态的转换是有成本的,则首先出现的均衡状态就将持续维持下去。
(3)b11A>b12A,b21A,b22A,设为:
这时,博弈的均衡解是两个主体都遵守制度,但实现均衡的过程会有两种情况:
一种情况是b21A≥b22A,设为:
即两主体中即使只有一个遵守制度,他的情况就比两主体都不遵守制度要好,这时,两主体都会自动分别采纳遵守制度的a行为,不必互相协商。
二是b22A>b21A,设为:
即两主体人中若只有一主体采纳遵守制度的a行为,则他的情况会比两主体都不采纳a行为更糟糕,这时,两主体都不会单独采纳a行为,必须经由协商,共同采纳a行为;或者存在着一个凌驾于A和B两主体人之上的人(比如说C)强制他们遵守制度。
(4)b21A>b11A,b12A,b22A,且b11A>b12A,设为:
这时,博弈的均衡是两主体都采取a。因为即便只有一主体采取a,他的境况也要比两主体都采取n要好,而一旦一个主体已采纳a后,另一个主体为改善处境,别无选择,只有也跟着采取a。但这里有两种情况,一是在前两个例子中,两主体都采取a比两主体都采取n要好,虽然从个人角度来看,最好是自己采取a而另一主体采取n。另一种情况是在第三个例子中,两主体都采取a比两主体都采取n要差,这个例子可用来说明何以一些人人都认为不好的制度会得以存在。
(5)b22A>b11A,b12A,b21A,设为:
这时,博弈的均衡是两主体都采纳n行为,不遵守制度。但实现均衡的过程也有两种情况:
一是b12A>b11A,设为:(www.xing528.com)
即两主体中即使只有一主体采纳n行为,他的情况就比两主体都采纳a行为好,这时,两主体无须协商就会各自自动采纳n行为。
二是b12A≤b11A,设为:
即两主体中若只有一主体采纳n行为,则他的情况会比两主体都采纳a行为更糟,于是两主体都不会单独采纳n行为,必定是经由协商同时采纳n行为。
在第一种情况下,均衡是由各人的独自行动自发实现的;而第二种情况下的均衡是通过协商同时采取行动实现的。
(6)b12A>b11A,b21A,b22A,且b21A<b22A,设为:
这时,博弈的均衡是两主体都采纳n行为,不遵守制度。且趋向均衡的过程都是两主体独立行动,不需要协商行动,因为这时b21A<b22A,即当某一主体不守制度后,若另一主体继续采纳a行为,则情况比他也同样采纳n行为要糟,于是他也一定效法另一人都采纳n行为。这种均衡有两种情况:一是b11A>b22A,即这一小节中假设的第一种情况。这就是所谓的囚犯困境博弈;二是b11A<b22A,如本小节假设的后两个例子,即两主体都采纳n行为的均衡局面比两主体都采纳a行为要好,但均衡时任一主体的得分要小于他不守制度而另一个守制度时的得分。这第二种情况正好对应从计划经济向市场经济过渡时的情况。可称作改革者博弈。设a为按计划制度办事,n为不按计划制度而按市场制度办事。初始状况是两主体都采纳a,这时有一主体(改革先驱)先不采纳a而采纳n,这时因另一主体仍采纳a,则改革者获得比原来高的收益,这可称作“头口水”收益,随后另一主体也跟着采纳n,则改革者的收益趋于下降,但两主体在均衡时的收益仍然比两主体都按计划制度办事时高。在这种博弈中,个人理性的结果是社会理性,个人追求最大化的结果是社会实现最大化。由本小节假设的后两个例子可知,改革者博弈有两种情况:一是当有人采纳n时,那个仍未采取n的人的情况比无人采纳n时更糟,如第二个例子所示,这意味着改革会有较大阻力;二是有人采取n时,未采取n的人的情况比无人采取n时要好,如第三个例子所示,这意味着改革阻力较小,也许没有。
(7)b12A>b11A,b21A,b22A,且b21A<b22A,设为:
这时,博弈存在多重均衡,就是非对角线上的两种情况,即一主体采取a而另一主体采取n,或者说两主体行为不一致。因为这时一旦有一主体采取了n后,另一主体若也跟着采取n,其收益将比他继续采取a更差。这种情况意味着一种制度即不可能被全部人遵守,但也不可能被所有人不遵守,只能在一部分人中间得到遵守。但究竟是哪部分人遵守,哪部分人不遵守,则取决于本博弈模型之外的因素。这种博弈也可分为两种情况:一是如第一个例子所示,b11A>b21A,即由于某主体不遵守制度的结果,另一个守制度的主体的状况比两主体都守制度时糟了;二是如第二、三个例子所示,b11A<b21A,即由于有人不守制度,结果使大家状况都有好转,虽然不守制度者好转得更大.这种情况可以现实中的过年禁放鞭炮的制度为例,当有部分人违禁时,无疑对违禁者和不违禁者都更有利,因后者也能享受到热闹气氛,但若所有人都违禁,则所有人的状况都将因噪音和烟尘而变得很糟,比所有人都不违禁还要糟。
(8)b21A>b11A,b12A,b22A,且b11A<b12A,设为:
这时,博弈存在多重均衡,即非对角线上的两种情况:一主体采取a而另一主体采取n。因为这时从任何一种统一行为状态(都采取a或都采取n)出发,一旦有主体采取另一种行为,都将提高他的自己的收益,而另一个在行为继续保持不变时,收益可能提高(第一例、第二例、第三例中以双a为出发点时的情况)。但若另一主体也随第一主体而改变自己原先的行为,则他的收益将比不学样时还要差。所以便会出现一种制度被某些主体遵守而被另一些主体不遵守的局面。与第(7)种情况相似。
以上8种情况都是两个地位平等的主体之间的博弈,剔除第(1)种情况,第(2)种情况导致人们可能普遍守制度或不守制度,第(3)、(4)种情况都导致人们普遍遵守制度,第(5)、(6)种情况导致人们普遍不守制度,采取非制度行为,第(7)、(8)种情况使一部分主体守制度同时另一部分主体不守制度。它们共同的特征在于制度的存亡与否完全是自发的,至多是协议的,并不存在一个博弈者受强制于另一个博弈者的情况。
下面分析第二类博弈,即同一个等级组织中两个地位不平等的人(领导与被领导、上级与下级,等)之间的博弈。
假定两人分别为领导(i)和被领导(j),j的策略为遵守制度(a)和不遵守(n),i的策略为放任自由(g)与实行管制(h),包括奖励守制行为和惩处不守制行为。于是两人之间的博弈矩阵如下:其中α为j遵守制度时的收益,α+hj为j从守制度和受奖励中得到的总收益;γ为i从j守制度中得到的收益,hi为i为奖励j而付出的成本,γ-hi为i在j守制度且对其进行奖励时所得的净收益;β为j在不守制度时的收益,dj为i对j不守制度进行的惩罚,β-dj为j不守制度且受到惩罚时的净收益;ε为j不守制度时i的收益,di为i实行惩罚付出的成本,ε-di为i在j不守制度且对其实行惩罚时的净收益,假设两人都追求最大收益,这个博弈有几种可能结果:
(9)α>β,γ>ε,则α+hj>β-dj,;γ-hi>ε-di(设hj=di),这时,均衡的策略组合为(g,a)即j采取a,i采取g,即i对j的守制行为采取自由放任态度。
(10)α+hj<β-dj,γ-hi<ε-di,则α<β,γ<ε,这时,均衡的策略组合为(g,n),i对j的不守制行为的采取自由放任态度。
(11)α<β,γ>ε,但α+hj>β>β-dj,γ-hi>ε>ε-di,这时均衡的策略组合不存在,存在着策略组合循环圈:(g,a)—→(g,n)—→(h,n)—→(h,a)—→(g,a)。但在重复博弈条件下,可能出现均衡组合(h,a)。
(12)α<β,γ>ε,但α+hj>β>β-dj,γ-hi<ε-di<ε,这时均衡的策略组合同样不存在,同样只存在与(11)相同的策略组合循环圈。重复博弈也不会出现均衡组合。
(13)α<β,γ>ε,且α+hj<β-dj<β,γ-hi<ε-di<ε,这时均衡策略组合为(g,n)。
(14)α<β,γ>ε,且α+hj<β-dj<β,γ-hi>ε>ε-di。这时i将设法增加hj,从而使得hi也相应增加,这种增加的结果或者出现第(11)种情况和第(12)情况,出现循环圈;或者出现第(13)种情况,出现均衡组合(g,n)。
由上述分析可知,在(9)和(11)这两种情况下将出现守制度的结果,但(9)是被领导者j自愿守制度,而(11)是被领导者j在i的强制下守制度。在(10)和(13)两种情况下将出现被领导者j采取非制度行动的结果,但(10)是i不愿强制j守制度的结果,而(13)是强制失败的结果。在(12)情况下将出现守制度和不守制度的周期循环。
可以用框图把制度、守制度行为和非制度行为、目标集合(包括两类目标)、及特定局势这几者之间的关系表达如下:在特定制度下,当所有人都选择个人的最佳行为时,所达到的特定局势可以看做是博弈的均衡解。这种局势给个人带来的有利结果便是该制度对个人的效用、给个人带来的不利结果便是该制度对个人的负效用。
(原载2001年第4期,人大报刊复印资料《理论经济学》2002年第2期全文转载)
【注释】
[1]夏姆·J·卡莫思:《制度变迁与经济理论——一种观点和一个折衷性综合》,载《世界经济译丛(京)》1993年。
[2]丹尼尔·W·布罗姆利:《经济利益与经济制度》,陈郁等译,上海三联书店2006年版。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。