混合策略就是局中人考虑以某种概率分布来选择他的各个策略。
定义3 m 维概率向量称为局中人甲的一个混合策略,即局中人甲选择策略 Si的概率为xi。
同理,可定义乙的混合策略。
由上面讨论可知,在一个矩阵对策G={S1,S2; A}中,局中人Ⅰ能保证的至少赢得是:
局中人Ⅱ能保证的至多所失是
一般地,局中人Ⅰ的赢得不会多于局中人Ⅱ的所失,故总有
当v1=v2时,矩阵对策在纯策略意义下有解,且VG=v1=v2。然而,实际中出现的更多情形是,这时,根据定义1,对策不存在纯策略意义下的解。例如,对赢得矩阵为
于是,当双方根据从最不利情形中选择最有利的原则选择纯策略,应分别选择α2和β1,此时局中人Ⅰ的赢得为5,比预期的至多赢得 v1=4还多。其原因在于局中人Ⅱ选择了β1,使局中人Ⅰ得到了本不该的赢得,故β1对局中人Ⅱ来说不是最优的,因此他会考虑出β2。局中人Ⅰ会采取相应的办法,改出α1以使赢得为6,而局中人Ⅱ有可能仍采取策略β1来对付局中人Ⅰ的策略α2。这样,局中人Ⅰ出α1和α2的可能性及局中人Ⅱ出β1和β2的可能性都不能排除,这对两个局中人来说,不存在一个双方都可以接受的平衡局势,即不存在纯策略意义下的解。在这种情况下,一个比较自然且合乎实际的想法是:既然局中人没有最优策略可出,是否可以给出一个选择不同策略的概率分布。如局中人Ⅰ可制订这样一种策略:分别以概率选取纯策略α1和α2,称这种策略为一个混合策略。同样,局中人Ⅱ也可以制订这样一种混合策略:分别以概率选取纯策略β1和β2。下面,给出矩阵对策混合策略及其在混合策略意义下解的定义。
定义4 设有矩阵对策G={S1,S2; A},其中S1={α1,…,αm},S2={β1,…,βn},A=(aij)m×n,记
则分别称为局中人Ⅰ和Ⅱ的混合策略集(或策略集);对称x 和y为混合策略(或策略),(x,y)为混合局势(或局势)。局中人Ⅰ的赢得函数记为
称为策略G的混合扩充。
不难看出,纯策略是混合策略的一个特殊情形。一个混合策略x=(x1,…,xn)T可理解为:如果进行多局对策G的话,局中人Ⅰ分别选取纯策略 α1,…,αm的频率;若只进行一次对策,则反映了局中人Ⅰ对各纯策略的偏爱程度。
例10-9 “剪刀、石头、布”游戏。若B的混合策略为(0.4,0.3,0.3),
则A 选“石头”的期望赢得为:0×0.4+1×0.3+(-1)×0.3=0;
A 选“剪子”的期望赢得为:(-1)×0.4+0×0.3+1×0.3=-0.1;
A 选“布”的期望赢得为:1×0.4+(-1)×0.3+0×0.3=0.1。(www.xing528.com)
若又已知A的混合策略为(0.5,0.2,0.3),则A的期望赢得为:
同理,B的期望赢得为-0.01。
下面讨论矩阵对策在混合策略意义下解的概念。设两个局中人仍如前所述那样进行理智的对策,则当局中人Ⅰ选择混合策略x 时,他的预期所得(最不利的情形)是因此,局中人Ⅰ应选取使得
同理,局中人Ⅱ可保证的所失的期望值至多是
显然,有 v1≤v2。
定义5 设矩阵对策是矩阵G={S1,S2; A}的混合扩充,如果
记其值为VG,则称VG为对策G的值,称使式(10.11)成立的混合局势(x*,y*)为G 在混合策略意义下的解(或平衡局势),称x*和y*分别为局中人Ⅰ和局中人Ⅱ的最优混合策略。
现约定,以下对矩阵G={S1,S2; A},即混合扩充一般不加以区别,都用G={S1,S2; A}来表示。当G 在纯策略意义下的解不存在时,自然认为讨论的是在混合策略意义下的解。
和定理1 类似,可给出矩阵对策G 在混合策略意义下解存在的鞍点型充要条件。
定理2 矩阵对策G 在混合策略意义下有解的充要条件是:存在使得对任意有
例10-10 考虑矩阵对策G={S1,S2; A},其中
由前面讨论,已知G 在纯策略意义下无解,故设x=(x1,x2)和y=(y1,y2)分别为局中人Ⅰ和Ⅱ的混合策略,则
则局中人Ⅰ的赢得期望是
故分别为局中人Ⅰ和Ⅱ的最优策略,对策的值(局中人Ⅰ赢得的期望值为)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。