大悟读书网 > 人文社科 > 博弈论 > 第二章 零和二人博弈——必然有输有赢

第二章 零和二人博弈——必然有输有赢

日常生活中,我们经常会陷入选择两难的困境,有时认为甲比较不错,有时又认为乙也令人满意。那么,我们对此应该做何选择呢?有些事情决策失误后还有重新选择的机会,但是有些事情一旦决策失误就会面临无法改变的状况。如何才能让自己做出正确的决策,远离痛苦和后悔的深渊呢?我们每个人都需要一种更好的选择方法,那就是博弈。

我们需要重视任何一次博弈,并且能充分地从历史资料和研究中掌握博弈的规则和理论,以此提升我们的博弈理论水平以及策略选择能力,更好地面对社会中重要的抉择。其实人生就是一场永无止境的博弈,我们需要学会在博弈中生存,与他人友好相处,以及学会适应和使用世界上的其他法则,在这个过程中更好地为自己做出选择。

一人博弈:一场“斗智”之战

前面的介绍与分析让我们了解到对于博弈的形式化的描述,也了解到了博弈策略的雏形,这让我们能够用简单、直观的形式对复杂的博弈做出清晰的概述。透过一些简单的博弈,让我们看到了前者与后者之间的等价关系。为了方便研究和讨论,我们还会用另外比较简单的方式给它们命名,我们将这些不同的命名方式称为广阔和正规化的不同形式。

我们对其的命名方式是完全等价的,我们可以按照在实际情况中较为方便的形式给它们不同的名称,而且这样的做法并不会影响到我们对其讨论的正确性和一般性。

事实上,那些非常正规化的形式更加适合于我们推导出博弈的一般定理,但是对于其中比较特殊的情况,还需要我们运用更加灵活多变、广阔的形式。换言之,正规化的方式能够帮助我们建立关于博弈所共有的性质,但是后者能够更加直观清楚地告诉我们不同的博弈之间性质的差别,以及如何解决这些博弈所出现的结构性差异。

我们已经对博弈进行了较为完整的描述,那么接下来就需要对此建立正面的理论。我们可以试着想象,若要建立这一理论,需要我们从简单的博弈逐渐过渡到复杂的博弈,这就意味着我们将按照其难度、复杂程度的递增次序对其进行讨论和研究。

我们可以根据参与博弈赛局的参加者数量对其进行划分,即由n个参与者参加的博弈属于n人博弈,同时,这也根据博弈是否为零和进行分类。由此一来,需要我们区分开零和n人博弈与一般n人博弈。

首先,我们对一人博弈做出说明。在正规化的形式中,我们能够看到一人博弈的组成是随机选择一个数,博弈中的唯一的局中人将会得到对应的结果。此时,我们能够非常明了地看出,零和的博弈中是一种空无一物的状态,那么我们便不需要对它再做出任何说明。

其实,我们能够用一种极其简单化的形式对一人博弈做出描述,假设我们用a表示博弈中变化的量,但它所表示的东西,并不只是在一个“着”中,而是代表了局中人的策略,它意味着在一个博弈赛局中所有可能出现的情况。同时,它也代表了这个局中人应对这些情况的所有策略和一套完整的“理论”。

此时,我们需要明白,即使一个人的博弈,可能出现的所有形式也可能是错综复杂的。简单地说,它有可能同时包括“机会的着”“人的着”,而且这些都属于同一个局中人,甚至每一种可能出现的“着”都包含着各种不同的走法。同时在出现任何一个“人的着”时,可以参照局中人掌握的情报信息,也可以根据提前设定的方案应对出现的情况。

我们可以列举出很多单人独玩的游戏,它们的表现形式复杂多变,而且十分细致,但是有一种非常重要的情况——我们所进行的单人独玩的游戏中没有渗透出上述的情形,而这正是不完全情报的一种体现。简言之,在同一局博弈中,唯一的局中人的不同的“人的着”中,具备先现性与前备性等价的情况的要求是:唯一的局中人有两个“人的着”,即A和B,在进行每个“着”时,局中人并不知道另一个“着”的选择结果,在情报不完整的情况下这种情况是难以实现的。

但是我们前面讲到过,可以通过把局中人拆分成两个或者多个具有相同利害关系,同时在情报交换方面是不完全的人,便能够实现先现性和前备性等价的情况。我们可以通过桥牌博弈的例子构造出类似于一人博弈的情形,只是单人游戏的多种形式都不属于这种博弈类型。还有一些双重单人游戏的规则是在两个参与者之间进行的竞争,它属于二人博弈的范畴。

这些情形在实际生活中有一定的意义,诸如一些分配方案的决策,当互相交换已经不存在时,且只有一个机构能够转嫁社会产品,那么所有的社会成员的利益关系是一致的。需要注意的是,在这种情况下,我们不能将每位成员都看作博弈的局中人,主要原因是在成员之间不存在利害关系,更不可能出现某些成员联手对付其他成员的情况。因此,我们需要将这个机构看成一个一人博弈,只是在这些社会成员之间存在着不同的联系,这就意味着其中可能会出现不同的不完全情报。

在这种严谨的分配方案的例子中,我们很难对此种分配方案自身进行鉴定,因此我们可以将分配方案与博弈规则联系起来。由于博弈的规则是绝对的、不容侵犯的、不接受批评的,我们可以通过对博弈策略的了解,简单地解决博弈规则内的方案分配问题。

“偷鸡”:“虚张声势”促成功

配铜钱、石头剪刀布等博弈相对简单,而且它们之间的广阔形式和正规化并无本质性的差别。但是,接下来我们所要讲到的是一种形式更加广阔的博弈,因为这些博弈中的局中人有若干个“着”,这就意味着在这些博弈中,广阔的形式和正规化的过渡之间变得更加丰满而有意义。

我们会对扑克中的博弈进行严格的讨论,而实际过程中的扑克相对复杂,但是我们又想进行极其细致的讨论。在此种情况下,可以对其进行一些简化处理,甚至是进行一些根本性的改变,方便我们对其中的博弈情况进行研究。基于此,我们对扑克的所有修改都会保留其最初的基本性质和观念。

实际上,扑克可以由任意人数参与,但是我们所要研究的是零和二人博弈,因此我们将参与扑克的人数规定为两人。

进行扑克博弈之前,我们将从所有的牌中拿出5张扑克牌给赛局中的每个人,在此种情况下,每个人所获得扑克牌的组合会有2598960种,这种情况下,我们将其称为一“手”牌。此时,每个人将自己所获得的扑克牌按照从大到小的顺序进行排列,按照我们的前提规定,即每个人一“手”牌的大小对应的是扑克牌的强弱。

其实,扑克牌在实际的玩法中有很多种,或者可以说它有多种变形,我们可以将是否换牌作为区分其是何种博弈的参照点,即“换牌”博弈与“不换牌”博弈两种。

在“换牌”博弈中,参与赛局的局中人可以换掉自己手上的某张扑克牌,或者换掉手上的所有扑克牌,而且这种换牌的方式是“千奇百怪”的。在某些换牌变形中,局中人手中的一“手”牌,往往是在同一赛局中相继获得的。相对来说“不换牌”博弈相对简单,即在同一赛局中,必须保证自己手上的扑克牌不发生变化。因此,我们为了在研究过程中偏向简单,所以只研究“不换牌”博弈。

在“不换牌”博弈中,赛局中的参与者便不需要将一“手”牌作为一手牌,这里所说的一手牌指的是局中人所获得的扑克牌的组合。假设我们令局中人所获得的扑克牌的总数为S,每个人所获得的扑克牌数为s。由于前面已经提到在博弈中如果使用全副牌,那么每个局中人手中的扑克牌的组合为S=2598960。由于发牌是按照一定的规则进行的,所以每个人获得扑克牌的可能性是相同的,那么从全副牌中随便抽取一张扑克牌的数作为s,而s便是赛局中的“机会的着”,而且两个局中人获得其中可能的值的概率是相同的。因此,“不换牌”博弈便由“有机会的着”开始了,我们将参与博弈的局中人分别命名为甲和乙,而给他们抽取的扑克牌数为甲1和乙2。

上述为扑克博弈的第一个阶段,通常情况下扑克博弈进行到第二阶段时,便需要赛局中的参与者进行“叫价”。所谓“叫价”,指的是两个参与者需要下赌注,而这个赌注有大有小,完全取决于局中人自己的决策。一般情况下,当其中的一个局中人“叫价”之后,另一个局中人会有三种选择,即“看牌”“不看牌”“加叫”。

“看牌”指的是这个局中人接受了第一个局中人的“叫价”,他需要将自己手上的扑克牌全部摊开,与“叫价”的局中人的扑克牌进行比较,最后两个局中人手上拥有较强的一“手”牌的局中人获胜,而且能够获得此次“叫价”的收益,并且结束此局博弈。

“不看牌”指的是,局中人愿意接受他在前一局中最后一次的“叫价”,而且他所接受的这个金额要比现在的数额低,而且两个参与者都没有其他的异议,此时,两个局中人便不会在意各自手上握有怎样的牌,因为他们手上的牌无须全部摊开。

“加叫”指的是,对方能够给出“叫价”者更多的叫价,以此还击“叫价”者给出的叫价,那么在这种情况下,两个局中人的地位便会发生反转,即前面“叫价”的局中人此时便会有三种选择:“不看牌”“看牌”“加价”。其余的对局,便以此类推。

但是,在进行扑克博弈的对局中,若是参与者中的一方手上握有强牌,那么他有极大的叫高价的可能性,而且会根据情况进行不少加叫,主要是因为他有足够的信心觉得自己能够在赛局中获胜。这就说明在他进行加叫或者叫高价的过程中,向他的对手释放了一个信息,即他的对手可以假设他手上握有强牌,那么对手在这种情况下,极有可能在进行决策时会选择“不看牌”。这也意味着,双方在“不看牌”的决策下,无法对双方的扑克牌进行对比。此时,若是手上的牌是弱牌的一方,他便可以选择加价或者叫高价,进而引起对手不看牌,以此达到一种自己手上握有强牌的假象,利用这种方式极有可能用手上的弱牌赢过对方手上的强牌。

在扑克博弈中,这种现象被称为“偷鸡”。显而易见,这种策略大都是在扑克博弈中有经验的参与者才经常使用的方法,但是对于上面的分析一定会有人产生异议,这种研究是否是“偷鸡”的真实原因呢?

其实,我们对此还有更容易理解的解释:当进行扑克博弈时,假设我们都知道其中的一个局中人手上握有强牌,他便会做出叫高价的行为;此时,面对这种情况,他的对手极有可能选择“不看牌”。因此,手上握有强牌的一方便不能再继续叫高价或者多加叫,正是出于此,他手中的牌才能够帮助他赢得此局博弈。所以,他在这种情况下,尽量不能让对手得知自己的真实情况,反过来说,他需要传递给对手的信息是自己手上握有弱牌,但是还在叫高价。

通过上面的分析,我们能够清晰地发现,扑克博弈中的“偷鸡”其实包含两种可能存在的动机:一种是其中的一个局中人手上握有弱牌,但是想要给对手营造出一种手上握有强牌的假象,进而混淆对方的决策。另一种是其中的一个局中人手上的确握有强牌,却要制造出一种自己手上其实是弱牌的假象。这两种动机都是为了向自己的对手传递出反面的信号,给对手的决策造成干扰,进而增大自己在博弈中获胜的可能性。

关于这两种动机是否能够获得更高的收益,还取决于对手最终的决策。比如在第一种情况下,若想真的“偷鸡”成功,需要对手真正选择“不看牌”,才能获得最终意义上的成功。而对于第二种情况来说,其中的一个局中人在对手选择“看牌”策略时,便能成功给对方制造混乱情报,最后获得此局博弈的胜利。

事实上,采用这种反方向的策略带有一定的风险性,由于其中的一个局中人无法判断出对手是否会顺着自己的方向走,所以这种“叫价”的方式自身具有冒险性。

假设使用了不正确的“偷鸡”法,便会偏离好策略,最后导致局中人利益受损。在这种情况下,对手只需要选择坚持一个正确的策略就可以了。当对手选择了一个完美的策略后,即使不正确的“偷鸡”法,也不会给局中人造成损失。但是,当对手在博弈赛局中逐渐偏离完美的策略后,便会给前面的赛局中的局中人造成损失。

这就告诉我们,若想成功地“偷鸡”,其实并不需要在博弈中遇到一个实力相当的对手,而是在于对手是否会在博弈赛局中偏离完美的策略,同时,“偷鸡”对这种情况是有所防备的。

通过上述描述,我们清楚地发现,扑克的此种变形所拥有的完美策略并非一成不变或者最佳的,所以在这种情况中,永久最优的策略是不存在的,而且“偷鸡”其实是在博弈中的一种具有防御性的措施。

你真的会打扑克吗?——“叫价”的艺术

我们在前面的研究中多次强调指出,让博弈中的两个局中人的策略选择相等,是零和二人博弈中最简单的一种方式。在这种博弈中,局中人的策略选择被称为纯策略。事实上我们不应该用这个名称,用“着”来表示似乎并没有显得太夸张。而且,在上面已经讲到的问题中,它们之间存在的广阔形式和正规化之间似乎没有任何明显的区别。因此,在这些类型的博弈中,我们会将“着”和策略等同起来,而这些原本就属于正规化的形式特征。但是我们现在将对一个广阔形式的博弈进行探究,这类博弈中的局中人有若干个“着”,而且这些“着”能够更直观地向正规化的形式和策略进行过渡。

扑克本身具有很多规则,正是这些技术性的规则才避免了赛局中的局中人进行无限次的加叫,保证叫价的次数是有限的。参与扑克博弈的双方,都会自动避免不现实的叫高价,为了避免对手在叫价的过程中出现超人意料的叫价,所以在每局博弈中,都规定了一个最高叫价的数值。除此之外,还规定不能出现过小的叫价,这种规定保证了博弈顺利进行。

在实际进行扑克博弈时,参与赛局中的任意一个人率先叫价,紧接着剩下的局中人进行轮流叫价。在这种博弈过程中,所包含的有利因素和不利因素自身就是一个非常有趣的问题。而且扑克本身是一个比较复杂的博弈,但是为了方便研究叫价和加叫次数的限制,我们将其进行简化。

扑克自身就具有一种不对称性,正是受到这种因素的影响,所以希望在研究的过程中不受这种情况的干扰,这样便能够研究出扑克在最简单的形式下的主要特征。基于此,我们假设参与博弈赛局的两个局中人,在博弈进行中都会根据自己的选择开叫,而且他们不知道另一个局中人做何决策,当这两个局中人分别选择完自己的叫价后,才让对方知道自己的叫价结果,简单说就是让对手知道自己的叫价究竟是“高”还是“低”。

在此基础上,我们再对此种扑克博弈进行简化:假设我们规定参与赛局的每个人都只有两种决策权,即“不看牌”和“看牌”。这就意味着,在进行此次博弈时,排除了“加叫”这种决策。简言之,“加叫”只是在用一种更加巧妙和激烈的方式来达成局中人的某种意图,只是早在其中的一个局中人进行高叫价的时候,便能展现出他的这种意图。由于我们想要更加直白、明了地看待扑克博弈的问题,所以要尽最大可能避免使用多种意图来表示此次博弈中的一种意图。

参照上面的方式,我们设定下面这些条件:除了赛局中的参与者不让对方知道自己的真实意图外,还要考虑到其中的一个局中人的决策被对方知道的情况。试想,当参与扑克博弈的局中人的叫价同为“高”或者同为“低”时,便需要两个参与者将自己手上的牌同时摊开,比较它们的大小。这时,某个局中人手上如果握有强牌,那么他将获得对方手上的数额;假设双方手上握有的牌大小相同,那么便不需要其中的一方进行支付。

除此之外,当其中的一个局中人选择了“高”的叫价,而另一个人选择了“低”叫价时,那么选择“低”叫价的一方便会有两种选择,即选择“不看牌”或者“看牌”。此时,当“低”叫价的一方选择“不看牌”时,而且在不考虑到手上的牌的强弱的前提下,便意味着他将付给对方自己低叫价的数值;当“低”叫价的一方选择“看牌”时,那就意味着他的选择发生了改变,即由“低”叫价变成了“高”叫价,针对这种情况的处理方式便会和最初都选择“高”叫价时一样。

我们再次对扑克的技术性规则进行讨论:在扑克博弈中,我们为了避免局中人会没有限制地加叫,便规定了局中人叫价次数是有限的,这便是终止规则。为了避免不切实际的叫高价发生,因为这对于对手而言将会产生不可预料的后果,所以在博弈赛局中规定了叫价以及加叫的一个上限数值,同时通常情况下,还会规定禁止过小的加叫。因此,我们将会给予叫价和加叫一个限制性的条件,我们在博弈进行前,就设定两个数目,a和b,而且让a>b>0。

同时,我们还规定博弈中的局中人的每次叫价,即要么叫价“高”,要么叫价“低”。在这种情况下,我们将前者定义为a,后者定义为b。叫价高低之间的比值是此次博弈中唯一有联系,并且会发生变化的因素。

假设在进行扑克博弈的过程中,a与b的比值明显比1大,那么这就说明博弈的风险和冒险性极高;相反地,若是a与b的比值仅仅比1大一点,那么这就意味着此次博弈较为安全。

现在,我们将叫价和加价的次数限制对整个博弈过程进行简化。实际上,在日常生活中进行扑克游戏时,其中的一个局中人率先开始叫价,之后局中人开始轮流叫价。

由于在扑克博弈中,其中的一个局中人拥有第一次叫加权,同时他也要第一个做出行动。这时,不仅有有利因素,还有不利因素,这自身就是一个非常有趣的问题。我们已经对扑克不对称形式进行过讨论,而且这个问题占有一定地位。只是我们在最初研究这个问题时,希望能够避开这个带有困扰性的问题。换言之,我们避免在此博弈中研究所有的不对称情况。由此一来,我们将会得到扑克博弈的最纯粹、最简单的形式下的重要特征。

为此,我们可以在进行扑克博弈前假设,赛局中的每个局中人都拥有自己的开叫,而且每个局中人在博弈中并不知道其他局中人的选择,当博弈的双方都做出自己的叫价后,其中一个局中人的选择才被另一个局中人得知,即让每个局中人清楚另外一个局中人的选择,这时才知道对手的叫价究竟是“高”还是“低”。

除此之外,我们还能对此种博弈进行简化:我们提供给赛局中的局中人两种选择,一种是选择“看牌”,另一种是选择“不看”。这就意味着,我们在进行此次扑克博弈时,并没有“加叫”这个选择。“加叫”在某种程度上只是局中人巧妙、强烈地表达自己的某种意图的方式,尤其是在一个高开叫价的博弈局中,更明显地表达出了这种意图。我们的研究目的是希望问题能够变得简单,所以会尽可能地避开这些用不同方式表达同种意图的情况。

根据上面的这些前提条件,我们对此做出下面的规定:当两个局中人所做出的选择被对方得知时,假设两个人都选择了“高”的叫价,或者同时选择了“低”的叫价,此时两个局中人手上的牌必须摊开,那么手上拥有较强牌的局中人,将从他的对手那里获得a或者b的数额。假设这两个局中人手上所拥有的牌是相等的,那么双方不需要进行支付。

除此之外,还有另外一种情况,当其中的一个局中人选择了叫“高”价,而另外一个局中人选择了叫“低”价。这时,选择了叫“低”价的人拥有两个选择,即选择“不看”或者选择“看牌”。当另外一个局中人选择了“不看”之后,在不考虑两手牌的强弱的情形下,他将支付给对手低价的数额;若他选择了“看牌”,则表示他的选择发生了改变——由叫“低”价转换成了叫“高”价。而对这种情况的处理方式,则与两个局中人都选择叫“高”价时一样。

我们对于上面提到的简化版的扑克博弈规则加以总结:参与博弈赛局的每个局中人,能够通过一个“机会的着”获得他的一“手”牌;然后,每个局中人可以通过一个“人的着”对a、b进行选择,简单说就是选择叫“高”价还是叫“低”价;最后,赛局中的每个局中人都了解了另外一个局中人的选择,但是他并不知道他手上的牌,即双方都知道自己手中的一手牌以及自己的选择。假设其中的一个局中人在博弈中选择了叫“高”价,而另外一个局中人的选择是叫“低”价,那么后者将会拥有两种选择,即“看牌”或者“不看”。

这是一场博弈赛局的过程,当一场赛局结束时,他们的支付方式如何呢?假设两个局中人同时选择了叫“高”价,或者一个局中人选择叫“高”价,而另外一个局中人选择叫“低”价,并且在后来还选择了“看牌”,那么前一个局中人将从后一个局中人那里获得三个数额,即a、0、-a;假设两个局中人都选择了叫“低”价,那么前一个局中人将从后一个局中人那里获得三个数额,即b、0、-b;假设另外一个局中人选择了叫“低”价,并且在后来选择了“不看”,那么,“人的着”属于选择了叫“低”价的人。

“优胜劣汰”:二人博弈中,到底谁为鱼肉?

我们暂时不对n个局中人的博弈T进行直接的研究,我们在现阶段还不具备此种条件,所以先对另外两个博弈进行思考和研究,因为它们与n个局中人的博弈有着紧密的联系,而且对它们的探究是我们能够非常轻易做到的。

关于n个人的博弈T的难点在于:参与博弈赛局中的局中人1在进行选择时,无法预测到此赛局中的局中人2会做出怎样的策略选择,反之亦是如此。由此一来,我们将带有这种困难的n人博弈T与没有这种困难的其他博弈进行简单的比较。

首先,我们用T1表示所要研究的博弈,它与博弈T在细节上的唯一不同之处在于:当局中人2要做出自己的策略选择时,局中人1必须已经做出了自己的策略选择。简单说,当局中人2进行选择时,已经清楚了局中人1的策略选择,这就意味着局中人1的“着”前备于局中人2的“着”。

在此博弈T1中,我们能够非常清晰地看出,局中人1所处的地位远远低于他在博弈T中的地位,这种博弈赛局相对于局中人1来说是十分不利的,因此我们将博弈T1称为博弈T的劣势博弈。

相似的,我们重新定义另一个博弈T2,它与博弈T唯一不同的细节在于:当局中人1做出自己的策略选择之前,局中人2必须做出自己的策略选择,这就意味着局中人1在做出自己的选择时已经知道了局中人2的选择,即局中人2的“着”前备于局中人1的“着”。在这个博弈中,我们能够明显地发现局中人1所处的地位远远比原来在博弈T中的地位有利,因此,我们讲博弈赛局T2是博弈赛局T的优势博弈。

我们借助这两个博弈T1、T2,帮助我们达到了以下目的:从常识方面来看,对于博弈T1、T2而言,我们清楚地了解到了参加博弈最佳的行为方式。另一方面,我们能够发现博弈T显然是处在博弈T1、T2“之间”。比如,我们从局中人1的角度来看,T1相对于T而言总是不利的,但是T1总是要比T有利。严格意义上说,这里的“不利”应该指的是“不利或者与其相等”,而“有利”则是指“有利或者与其相等”。

由此一来,我们可以想象博弈T中所有重要的量,T1、T2能够帮助它们提供上、下界。事实上,我们还可以用更加严格的形式讨论其中的问题。考虑到上界和下界之间的问题,那么我们在很大程度上,对于博弈T的认知和了解都是不确定的。若是初看起来,很多博弈中的情况都是如此。但是我们可以利用这种技巧,找到某些新的方法,以便在最后能够找到一套严谨的关于博弈T的理论,而且它能够对所有的问题给出合理的解释。

我们针对劣势博弈T1进行讨论,当局中人1做出了自己的策略选择后,局中人2知道了局中人1的选择,并做出了自己的选择。由于局中人1先做出了选择时,他对整个博弈的情况有了简单的了解,便能够做出对自己有利的策略选择。

上面所讲到的情况比较特殊,但是我们能够十分清楚地看到它们之间的相互关系,这能够帮助我们在更加复杂的情况中认识它们,而且这种方式能够帮助我们更加准确地做出判断。

再来考虑优势博弈T2,T2与T1是不同的,不同之处在于局中人1和2的地位发生了转变,即局中人2需要率先做出自己的策略选择,在此基础上,局中人1在清楚局中人2的策略选择之后,才做出自己的策略选择。在这种情形下,我们可以在博弈T1中将局中人1和2进行互换,由此一来便得到了博弈T2。

我们应该清楚博弈T1和T2之间存在着一种对称关系,当对T1和T2的局中人进行互换之后,我们就能从一个研究跨越到另一个研究中,仅从博弈自身来看,这种T1和T2之间的互换是不具有对称性的。实际上,正是由于局中人1和2的互换,使得博弈T1和T2发生了互换,因此,不管是局中人还是两个博弈都发生了改变。

在此,我们应该观察到,博弈T相对于两个局中人1和2来说,在这两个博弈中所处的地位都是不同的,而且有着本质的区别。对于博弈T而言,它处于T1和T2的中间地位,可以采用同样的方式对一个博弈的局进行定义。这些只是一些具有启发性的阐述,直到现在我们还未对博弈T做出证明,通过上述的一些简单讨论,我们逐渐将剩下的空白进行填补,针对现阶段而言,我们的讨论还受到一些限制,但是借用一些新的技巧就有机会解决这些困难。

国际象棋——有智还需有谋

我们已经讲到过关于先现性与前备性是等价的,即具备完全情报的零和二人博弈。这种博弈被称为具有有理性质的博弈。同时我们还证明了这种博弈是严格的,当任何博弈包含“机会的着”时,我们的证明依然成立,而这种事实则是无法根据“通常看法”验证的。

国际象棋自身不具有“机会的着”,而双陆则含有“机会的着”,但它们都属于完全情报博弈,对于所有的这类博弈而言,我们已经讨论过它们具有一个固定的、最佳的策略,只是我们用一种抽象的形式证明了它们的存在性。在大多数情况下,需要我们对它们的结构进行研究,但是它们比较复杂、冗长,还无法在实际中得到应用。

因此,我们将更加细致地对国际象棋进行研究和考察。

最后,我们用一种简单又不形式化的方式针对我们的讨论做出总结,即所有具有完全情报的零和二人博弈都是需要严格确定的。说到这里,一定会有读者十分疑惑,究竟哪种讨论不能算是一个系统的论证呢?我们需要系统地将可信的论证进行归纳,并且我们能够对上述所有类型的博弈T的任意赛局,给出合理的答案,但是这种论证过程会遇到一些难题。事实上,我们在对博弈赛局进行讨论时,没有必要解决掉所有的困难。

一般情况下,在那些具备完全情报的博弈中,我们将采用不同的思路得到最佳的博弈的解。由此一来,便能够让零和二人博弈与一般情形下的差别表现得更加明了,这足以说明处理一般情况时,不得不采用完全不同的方法。

在零和二人博弈的对局中,我们可以假设对手的博弈行为的合理性,倘若对手的行为是不合理的,那就意味着不会给另外的局中人造成不利。事实上,参与零和二人博弈的局中人只有两个,而且利益的和为零。在此种情形下,对手需要为自己的不合理的行为承担损失,同时将会给另一个局中人带去相等的收益,这样的论据在现阶段来看并不十分精准,但是我们能够在某种程度上让它变得更加准确,不过我们并不需要在这里对它进行讨论。

初等博弈中的特殊例子

前面我们已经讨论过零和二人博弈的例子,接下来我们将对其中包含的特殊例子进行讨论。而且,我们将要研究的这些特殊案例,能够更好地帮助我们认识到所研究的理论的各个组成部分。特殊之处在于,它能够帮助我们对理论中的某些形式化的东西进行直观的解释。针对那些“实际的”“心理上的”某些现象,得到较为严格的形式化体系,尤其是那些在通常意义上被认为不容易用严谨的方法进行处理的东西。

我们假设在正规的博弈中,两个局中人所能采用的策略的数量分别为b1和b2,而且针对这两个策略数目的大小对博弈的影响做出了简单的统计,在这里我们不讲两个数之一,或者二者都为一的情况。在此种情况下,其中的某个局中人对于博弈的影响并不重要,甚至可以说局中人没有选择的余地。此时,这里所讲到的博弈实际上是一人博弈,而且不是零和的。所以,我们在讨论这类博弈时,最简单的方式就是让b1和b2相等。