博弈论简介:带你走进博弈论
一、博弈论
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的罗伯特·奥曼教授的说法,博弈论就是研究互动决策的理论。所谓互动决策,即各行动方的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑纳入考虑之中,在如此迭代考虑情形进行决策,选择最有利于自己的战略决策。
通俗地说,博弈论就是一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并从中取得各自相应结果或收益的过程。
二、博弈的要素
1.决策人
在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
2.对抗者
在博弈两人对局中行动滞后的那个人与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
3.生物亲序
所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在博弈中指参与者在从混乱的环境中等待、寻找有序的亲近行为。
4.局中人
在一场竞赛或博弈中,每一个有决策权的参与者都是一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
5.策略
一局博弈中,每个局中人都可以选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人有有限个策略,则称为“有限博弈”;反之,称为“无限博弈”。
6.得失
一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。
7.次序
各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,这样就出现了次序问题;其他要素相同次序不同,博弈就不同。
8.均衡
所谓纳什均衡,它是一种稳定的博弈结果。
三、博弈的类型
1.合作博弈与非合作博弈
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈;如果没有,就是非合作博弈。
2.完全信息与不完全信息博弈
参与者对所有参与者的策略空间及策略组合下的支付函数有充分了解称为完全信息;反之,则称为不完全信息。
3.静态博弈与动态博弈
静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗地理解:“囚徒困境”就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
信息不对称:隔行如隔山
一、信息与完全信息
信息指交易中的各人拥有的资料不同。一般而言,卖家比买家拥有更多关于交易物品的信息,但相反的情况也可能存在。前者例如二手车的买卖,卖主对该卖出的车辆比买方了解;后者例如医疗保险,买方通常拥有更多的信息。
完全信息是指信息对于双方来说是完全公开的,双方所作的决策是同时或者不同时的,但在对方做决策前不为对方所知的。完全信息博弈是不完全信息博弈的对称博弈类型。如果一个博弈的所有参与者都知道每个参与者的类型特征、对策和收益函数,则为完全信息博弈。
信息不完全不仅是指那种绝对意义上的不完全,即由于认识能力的限制,人们不可能知道在任何时候、任何地方发生任何情况,而且是指相对意义上的不完全,即市场经济本身不能够生产出足够的信息并有效地配置它们。
二、信息经济学
信息经济学逐渐成为新的市场经济理论的主流,研究信息经济学的学者因而获得了1996年和2001年的诺贝尔经济学奖。1996年,詹姆士·莫里斯和威廉姆·维克瑞,2001年,乔治·阿克尔洛夫、迈克尔·斯宾塞和约瑟夫·斯蒂格利茨,他们都因为对信息经济学的研究而获得诺贝尔经济学奖。
人们打破了自由市场在完全信息情况下的假设,才终于发现信息不对称的严重性。信息经济学的价值不在于揭示了信息不对称,而在于说明了信息和资本、土地一样,是一种需要进行经济核算的生产要素。
俗话说,隔行如隔山。这座山其实就是信息不对称,而要获得这些信息是要付出成本(代价)的。消费者往往没有对商品的生产信息等投入成本,这必然与生产者之间产生信息投入成本差异,生产者利用信息投入差异获取利润正是为了补偿先前付出的信息成本。其实质仍然是资本的获利性在另一种层面上的体现,只不过我们剥离了资本,换了一种观察的角度而已。
占有信息的人在交易中获得优势,交易关系因为信息不对称变成了委托—代理关系,交易中具有信息优势的一方为代理人,不具有信息优势的一方是委托人,交易双方实际上是在进行无休止的信息博弈。
信息经济学认为,信息不对称造成了市场交易双方的利益失衡,影响社会的公平、公正的原则以及市场配置资源的效率,并且提出了种种解决的办法。
作为一种有价值的资源,信息不同于普通商品。人们在购买普通商品时,先要了解它的价值,看看值不值得买。但是,购买信息商品却无法做到这一点。人们之所以愿意出钱购买信息商品,是因为还不知道它,一旦知道了它,就没有人会愿意再为此进行支付。这就出现了一个困难的问题:卖者让不让买者在购买之前就充分地了解所出售的信息商品的价值呢?如果不让,则买者就可能因为不知道究竟值不值得而不去购买它;如果让,则买者又可能因为已经知道了该信息商品也不去购买它。在这种情况下,要想做成“生意”,只能靠买卖双方的并不十分可靠的相互信赖:卖者让买者充分了解信息商品的用处,而买者则答应在了解信息商品的用处之后即购买它。
三、不完全信息动态博弈
贵州原本没有毛驴,因此一头毛驴刚到贵州的时候,老虎见它是个庞然大物,不知道有多大的本领,感到很神奇。老虎就躲在树林里偷偷地瞧毛驴。
过了一阵子,老虎走出树林,逐渐接近毛驴。毛驴突然大叫一声,老虎吓了一跳,急忙逃走。过了几天,老虎又来观望,发现毛驴并没有什么特别的本领,对毛驴的叫声也习以为常了,但老虎仍然不敢下手。
再后来,老虎跟毛驴挨得更近,往毛驴身上又挤又碰的,故意冒犯它。毛驴在忍无可忍的情况下,用蹄子去踢老虎。到这时,老虎对毛驴已经有了完全的了解,毫不费力地扑上去把它吃掉了。
在故事中,老虎通过观察毛驴的行为逐渐修正对它的看法,直到看清它的真面目,再把它吃掉,老虎的每一步行动都是在给定它的信息下最优的选择。事实上,毛驴的行为也是很理性的,它知道自己技能有限,所以不到万不得已的时候是不用那仅有的一技的,否则它早就被老虎吃掉了。实际上,这个故事是一个典型的不完全信息动态博弈的均衡。
智猪博弈:做大猪还是做小猪
一、智猪博弈模型
假设猪圈里有一头大猪、一头小猪,它们在同一个石槽里进食。猪圈的一头有猪食槽,另一头安装着控制猪食供应的踏板,踩一下踏板会有10个单位的猪食进槽,但是谁踩踏板就会首先付出两个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,大小猪收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去踩踏板的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费两个单位的成本)。而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动。在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1个单位。如果小猪也选择等待的话,那么小猪的收益为零,成本也为零(如表2-1所示),总之,等待还是要优于行动。
表2-1 智 猪 博 弈
在智猪博弈模型中,受罪的都是大猪,小猪等着就行。智猪博弈模型可以解释为谁占有更多资源,谁就必须承担更多的义务。
智猪博弈存在的基础,就是双方都无法摆脱共存局面,而且必有一方要付出代价换取双方的利益。一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被瓦解。
对小猪而言,不管大猪踩不踩踏板,自己不去踩踏板总是最好的选择。而大猪呢?它知道小猪是不会去踩踏板的,与其两者一起饿肚子,自己去踩踏板总还能获得食物。于是,主动去踩踏板成了大猪的唯一选择。这就出现了,同样聪明的两头猪,却有不一样的付出:小猪舒舒服服地等在投食处,而大猪不得不来回奔波于踏板和食物之间。
二、大猪小猪轮流做
赤壁之战是我国历史上的著名战役,实际上,赤壁之战中的孙权一方扮演的就是智猪博弈中“大猪”的角色,刘备一方则是拣了个大便宜的“小猪”。赤壁正面作战的是孙权,出大力的也是孙权,但最大的胜利果实——荆州却被刘备占据。多出力并没有多得,少出力并没有少得,这就是孙刘在赤壁之战中的博弈结果。但孙权必须要做这只“大猪”,不然东吴必定被曹操所吞并。
智猪博弈告诉我们,多劳却并不一定多得。这是因为“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。在现实生活中,很多人都只想付出最小的代价,得到最大的回报,争着做那只坐享其成的小猪。其实每一个人在工作中所扮演的角色,不是“大猪”,就是“小猪”。既然有一些人会成为不劳而获的“小猪”,那么必定有另一些人去充当费力不讨好的“大猪”。
小李在一家合资企业上班,但所在的部门却只有三个人。这三个人正好分为三个等级:部门经理、经理助理和普通员工。小李正好是那个经理助理,处于中间级别。由于在这个部门中,小李表现得最积极,慢慢地,其他部门的同事也认识到:办事就找小李。有时候,公司老板也直接给小李派任务。小李桌上的文件越堆越高,一上班,他就忙得连轴转,像个不断打转的陀螺。部门经理和员工小张则每天无所事事,乐得逍遥自在。
到了年底,由于部门成绩出色,公司特别奖励了4万元,经理独得2万元,小李和小张各分得1万元。小李想到自己辛苦了一整年,到头来却和小张拿得一样多,心里觉得很憋气。
但是,小李心里明白:如果自己不拼命干活,那他连这1万元都得不到,因为指望经理和小张是得不到奖金的。思前想后,小李还得继续当那头辛勤的“大猪”。
“大猪”拼命干活,“小猪”跟着拿奖金,这样的事情在很多公司都存在。“大猪”明知道“小猪”过的是不劳而获的生活,也知道“小猪”是不会去主动完成任务的,为了不至于最后落得大家都没“食物”吃,“大猪”总是会跳出来去踩那个踏板。
不过,在工作中,说到底还得凭真本事、靠实力。“小猪”们不劳而获的日子虽然安逸,却并不稳定。他们总得依靠“大猪”吃饭,心里总是没底的:万一哪天,“大猪”一气之下,跳槽走人,自己可就得饿肚子了。而且如果工作的性质发生改变,比如不再是团队合作性质的工作,而变为侧重独立工作的任务,那“小猪”们可就不能再心安理得地坐等“食物”掉下来了。
“大猪”们付出了很多,虽然得到了回报,却和付出不相当。而“小猪”们可以在短期内坐享其成,却不是长久之计。其实在生活当中,我们每一个人都会面临自己不得不吃亏的现实,但往往只有自己吃点明亏,才会得到更多。
事实上,最智慧的表现应该是:既要有做“大猪”的实力,也要有做“小猪”的策略,两个角色交替,才会获得更多的幸福。(www.xing528.com)
枪手博弈:先发优势与后发制人
一、枪手博弈模型
彼此痛恨对方的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。我们来推断一下:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?
一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的概率最大。我们来分析一下各个枪手的策略。枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些的。
通过概率分析,发现枪法最差的丙存活的概率最大,枪法好于丙的甲和乙的存活概率远低于丙的存活概率。
由此可以看出,在多人博弈中常常由于复杂关系的存在,而导致出人意料的结局。一位参与者最后能否胜出,不仅仅取决于自己的实力,更取决于实力对比关系以及各方的策略。
二、坐山观虎斗
在曹操击败袁绍后,袁绍的两个儿子袁尚、袁熙投奔乌桓。为清除后患,曹操进击乌桓。袁氏兄弟又去投奔辽东太守公孙康。曹营诸将都建议曹操进军,一鼓作气平复辽东,捉拿二袁。曹操没有听从将领们的意见,只在易县按兵不动。过了数日,公孙康派人送来袁尚、袁熙的头颅,众人都感到惊奇。曹操将郭嘉的遗书出示给大家,他劝曹操不要急于进兵辽东,因为公孙康一直怕袁氏将其吞并,现在二袁去投奔他,必引起他的怀疑,如果我们去征讨,他们就会联合起来对付我们,一时难以取胜。如果我们按兵不动,他们之间必然会互相攻杀。结果正如郭嘉所料,大家深为叹服。
郭嘉的策略就是“坐山观虎斗”,最终获得了自己所希望的结果。如果面对不止一个敌人的时候,切不可操之过急,免得反而促成他们联手对付你,这时最正确的方法是静止不动,等待适当时机再出击。这与枪手博弈有异曲同工之妙。
我们在西方政治竞选活动中也会看到有关枪手博弈的影子。只要存在数目庞大的竞争对手,实力顶尖者往往会被实力稍差的竞选者反复攻击而弄得狼狈不堪,甚至败下阵来。等到其他人彼此争斗并且退出竞选的时候再登场亮相,形势反而更加有利。
因此,幸存机会不仅取决于你自己的本事,还要看你威胁到的人。一个没有威胁到任何人的参与者,可能由于较强的对手相互残杀而幸存下来。就像上文中所讲的甲枪手虽然是最厉害的枪手,但他的幸存概率却最低。而枪法最差的枪手,如果采用最佳策略,反而能使自己得到更高的幸存概率。
有时候,生活中的枪手博弈其实更是一种置身事外的艺术。《清稗类钞》中记载了这样的故事:
清朝末年,湖广总督张之洞与湖北巡抚谭继洵不和,两人在黄鹤楼上吃宴席时借着酒劲又争辩起来。谭继洵说长江江面宽五里三分,张之洞却说是七里三分,督抚两人相持不下,在场众僚莫衷一是。江夏知县陈树屏被迫发言:“江面上涨,为七里三分;江面水落,为五里三分。两位大人所言极是。”张谭两人抚掌大笑,僵局就此化解。
而在激烈的市场竞争中,枪手博弈的运用更是无处不在。
博弈的精髓在于参与者的策略相互影响、相互依存。对于我们而言,无论对方采取何种策略,均应采取自己的最优策略!
斗鸡博弈:前进还是撤退
一、斗鸡博弈模型
清康熙时,文华殿大学士兼礼部尚书张英在京为官。在他老家桐城,他的邻居吴氏是当地的豪绅大户,欲侵占张府的宅地,家人驰书京城,要张英凭官威压一压吴氏气焰。谁知张英却回诗一首:“一纸书来只为墙,让他三尺又何妨。长城万里今犹在,不见当年秦始皇。”意思很明白:退让。家人得诗,主动退让三尺。吴氏闻之,也后撤三尺,于是形成了六尺宽的巷道,这就是“六尺巷”的由来。1958年,毛泽东接见前苏联驻华大使尤金时,曾引用过此诗,意在说明不与人计较斤两得失,大度处之。
由此可见,懂得退让并不是一种懦弱和失败,而是一种智慧。我们在工作和生活中要知道进退的道理,不要等到斗得两败俱伤的时候灰再溜溜地败下阵来。由这则故事可引申出博弈论中一个著名的博弈模型——斗鸡博弈。
斗鸡博弈,又称为懦夫博弈。斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。我们简单分析一下斗鸡博弈。
两只实力相当的斗鸡狭路相逢,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果斗鸡甲退下来,而斗鸡乙没有退下来,那么乙获得胜利,甲就很丢面子;如果对方也退下来,双方则打个平手;如果甲没退下来,而乙退下来,甲则胜利,乙则失败;如果两者都前进,则两败俱伤,如表2-2所示。
表2-2 斗鸡博弈的收益矩阵
因此,对每个人来说,最好的结果是,对方退下来,而自己不退。但是这种追求可能导致两败俱伤。
表2-2中数字的意思是:两者如果均选择前进,结果是两败俱伤,两者均获得-2的收益;如果一方前进,另外一方后退,前进者获得1的收益,赢得了面子,而后退者获得-1的收益,输掉了面子,但没有两者均前进受到的损失大;两者均后退,两者均输掉了面子,获得-1的收益。
斗鸡博弈有两个纯策略纳什均衡:一方前进,另一方后退;一方后退,另一方前进。但关键是谁进谁退?在现实中,哪一只斗鸡前进,哪一只斗鸡后退,要进行实力的比较,谁稍微强大,谁就有可能得到更多的前进机会,但前进的代价依旧是两败俱伤的结局。一旦进入骑虎难下的博弈,尽早退出是明智之举。有时候,双方都明白两者相争必有损伤,但往往又过于自负,觉得自己会取得胜利,这就是所谓“当局者迷,旁观者清”。斗鸡博弈往往最后得到的是一种“驴子式的胜利”。
二、谁前进,谁后退
伊索寓言中有一个“驴子和驴夫”的故事。驴夫赶着驴子上路,但驴子逐渐偏离平坦的大道,沿着陡峭的山路走去。当驴子靠近悬崖边时,驴夫抓住驴子的尾巴,想把它拉回来。可驴子拼命挣扎,驴夫抓不住,驴子从山崖上滑下去了。驴夫无可奈何地说:“你胜利了!”
但是凡事都要决出输赢胜负,那么必然会给自己带来不必要的损失。只有一方先撤退,才能使双方获利。特别是占据优势的一方,如果具有这种以退求进的智慧,提供给对方回旋的余地,就会给自己带来胜利,而且双方都会成为利益的获得者。
有时候,当双方相争的时候,只要把形势说明,等双方都明白自己并没有稳操胜券的能力,僵持不下的斗鸡博弈就会化解了。
我们可以发现生活中常有这样的例子,比如男女双方结婚之后,因为一些家庭琐事就像两只斗架的公鸡,斗得不可开交。婚姻双方的斗鸡博弈,使整个家庭“战火纷纷,硝烟弥漫”。一般来说,到关键时候,总有一方对于对方的唠叨、责骂装聋作哑,或者妻子干脆回娘家去冷却怒火,或者丈夫甩门而出找朋友诉苦,一场干戈化为玉帛。
在现实中,谁前进,谁后退,其实是实力的比较,谁实力强谁就有可能得到更多的前进机会。但这种前进并不是没有限制的,而是有一定的距离。一旦超过了这个界限,只要有一只斗鸡接受不了,那么斗鸡博弈中的严格优势策略就不复存在了。
酒吧博弈:混沌系统中的策略
一、酒吧博弈模型
美国著名的经济学专家阿瑟教授(W.B.Arthur)1994年在《美国经济评论》发表的《归纳论证的有界理性》一文中首次提出这样一个博弈模型:
有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。
假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何作出去还是不去的决定呢?
这个博弈的前提条件作了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其他的信息可以参考,他们之间更没有信息交流。
酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60人,而决定不去,那么酒吧的人数会很少,这时候作出的这些预测就错了。反过来,如果有很大一部分人预测去的人数少于60人,他们因而去了酒吧,则去的人会很多,超过了60人,此时他们的预测也错了。
因而一个作出正确预测的人应该是,他能知道其他人如何作出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何作出预测,因此所谓正确的预测几乎不可能存在。
阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态。虽然不同的博弈者采取了不同的策略,但是其中共同点是这些预测都是用归纳法进行的。在这个实验中,更多的博弈者是根据上一次其他人作出的选择而作出这一次的预测。然而,这个预测已经被实验证明在多数情况下是不正确的。那么,在这个层面上说明,这种预测是一个非线性的过程。所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”。
通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60∶40,尽管每个人不会固定地属于去或不去的人群,但这个系统的比例是不变的。如果把计算机模拟实验当作是更为全面的、客观的情形来看,计算机模拟的结果说明的是更为一般的规律。
二、少数人博弈
生活中有很多例子与酒吧博弈的道理是相通的。股票买卖、交通拥挤以及足球博彩等问题都是这个模型的延伸。对这一类问题一般称之为少数人博弈。少数人博弈是改变了形式的酒吧问题的延伸。
在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格高,你将获利。
在实际生活中,股民采取什么样的策略是多种多样的,他们完全根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用少数人博弈来解释。
少数人博弈中还有一个特殊的结论,即记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储大量股票历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。
少数人博弈还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。
实际的城市道路往往是复杂的网络。我们简化问题,假设在交通高峰期间,司机只面临两条路的选择。这个时候,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程,也不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走。当然,所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择,必须考虑其他司机的选择。
在司机行车的少数者博弈问题中,司机经过多次的选择和学习,许多司机往往能找到规律性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规律性。
在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而能躲开塞车的路段;有的司机因经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守,宁愿选择较少堵车的较远的路线,等等。最终,不同性格、不同经验司机的路线选择,决定了路线的拥挤程度。
重复博弈:杜绝一次性交易
一、重复博弈模型
旅美作家林达在其著作《历史深处的忧虑》中讲到这样一则事例:
在美国,任何一个售报机,都是一个铁盒子。所有的报纸都在里面,放一个硬币就可以全部打开,取一张之后再把它关上。作者说他第一次买报的时候,塞进硬币,一拉开盖子,发现所有的报纸都在他面前时,吓了一跳。因为根据他在中国的经验,这样的设计会使得报纸一下子就被人拿光。但是,这是根据美国的国情设计的,美国人不会扔一个硬币,却拿两份报纸。而且作者很快发现了例外——中国人聚居地的中国饭店、中国商店门口,就是一种特殊设计的售报机,一个硬币只拿得出一张报纸。关于此事,在美国的华人报纸上引发了诸多议论,其中一个华人讲述了在半小时里,他如何活生生地眼看着同胞们“免费”取光了一大堆报纸。
国内还发生了一则与上述事例相反的事件:
一个叫王波的卖报摊主,因为夫妇两个又要带孩子,还要打理一个书刊摊,所以把自己在成都近郊金名苑市场小区门口的报摊办成了“诚信报摊”,报架上写了“请给5角买报”的油漆字,还放了一个装钱的口袋。3年来,这个报摊每天都会卖出报纸100多份,但从来没有少过钱。
关于王波卖报摊的“奇迹”,有人将其归因为小区居民素质高,但一位长期在附近蹬三轮车的师傅却说:“是市场门口人多不敢随便拿。诚信报摊位于市场门口,来往的人很多,而且旁边有几家商铺,那么多人盯着,哪个敢拿?”
其实比起“素质高”,关于“不敢拿”的判断,似乎更为符合常理。我们可以把这个“诚信报摊”看作摊主与买报人之间的博弈,从博弈过程来看,“诚信报摊”成立第一天那种“每个博弈者都只关心一次性支付的简单博弈”已经转变成了“重复的、连续进行的博弈”,连续博弈的过程中,偷报者必然会担心卖报人可能采取暗中观察、抓住偷报者示众等报复措施,所以会理性地克制投机行为、选择诚信与合作,于是必然就出现了双方都诚信的博弈结果。
那么,为什么美国的无人售报机中的报纸会被中国人拿光呢?莫非中国人在自己国家内诚信,到了美国就不诚信?这是因为美国售报机位置多设在流动人口比较大的地方,而一个人之所以敢从售报机中拿走所有的报纸,原因就在于这周围的人都是过客,没有人认识他,明天也不会再从这个售报机拿“免费”报纸。也就是说,这是一个单次博弈,而非重复博弈。
当发生有限次的博弈时,只要临近博弈的终点,博弈双方会采取不合作策略的可能性加大。理发的人必定不会再到这个理发铺来理发,因此他才采取了不合作的策略。
因为一次性博弈的大量存在,引发了很多不合作的行为。在现实的世界中,所有真实的博弈只会反复进行有限次,但正如理发铺不知道客人下一次是否还会光顾一样,没有人知道博弈的具体次数。既然不存在一个确定的结束时间,那么这种相互的博弈一定会持续下去,博弈双方往往会采取合作的方式,实现阶段性的成功。因此,从博弈的角度出发,只要仍然存在继续合作的机会,博弈双方往往都会比较克制。
在现实生活中,我们往往能发现这样的情况:在公共汽车上,两个陌生人会为一个座位而争吵,可如果他们相互认识,就会相互谦让。这是因为人们之间是一种“不定次数的重复博弈”。在较长的视野内,人与人交往关系的重复所造成的“低头不见抬头见”,因此使得自私的主体之间走向合作。事实上,重复博弈更逼真地反映了日常人际关系。在重复博弈中,合作的长期性能够纠正人们短期行为的冲动,为以后的长期利益,必须维持好与周围人的人际关系。
二、小心一锤子买卖
重复博弈同样可以解释很多商业行为。我们可以发现在车站和旅游景点这些人群流动性比较大的地方,不但商品和服务质量差,而且假货横行,因为商家和顾客没有“下一次”的博弈机会。游客因为质优价廉而再次光临的可能性微乎其微,因而,大多数人的选择是“一锤子买卖”,不赚白不赚!一次性买卖往往发生在双方以后不再有买卖机会的时候,特点是尽量牟取暴利并且带有欺骗性。而靠“熟客”“回头客”为主要顾客群的厂商,他们一般会通过薄利多销的行为使得双方能继续合作下去,他们一般不会“宰客”。
实际上,我们也可以借用博弈论来解释夫妻之间的一些行为。夫妻之间的博弈不是一次博弈,而是多次博弈。也正是由于夫妻之间博弈的重复性,所以在博弈过程中只要双方还在理智的情况下,谁也不敢动真格地整治对方,只是吓唬吓唬而已。丈夫打妻子,他不敢真正下狠手,而妻子一般也不敢闹得太过分,因为他们都明白,仅为一时出口气而给对方造成的伤害,到头来还得要自己来承担。也正因为这样,夫妻之间都知道:“别看你现在这么凶,其实你并不敢真的把我怎么样。”所以有许多家庭,只要一方挑起事端,另一方就会积极应战,夫妻之间的博弈就时断时续。所谓“争争吵吵,相伴到老”,其实就是对这种博弈情形的形象写照。因为对于夫妻而言,博弈的目的不是为了在分手时能得到更多的“好处”,而是希望能更好地维持合作的稳定性,从而缔结连理,白头偕老。
一般而言,在经历多次的博弈之后,会达到一个均衡点——纳什均衡。在纳什均衡点上,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。也就是说,此时如果他改变策略,他的收益将会降低,每一个理性的参与者都不会有单独改变策略的冲动。因此,在经历了多次重复的博弈后,博弈的双方都不希望这种最优状态发生改变,这种相对稳定的结构会一直持续下去,直到博弈的终点。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。