大悟读书网 > 人文社科 > 博弈论 > 附录一 博弈论定律

附录一 博弈论定律

枪手博弈

从心理学的角度来看,最初去酒吧的那些人可能互相不熟悉,但是由于经常去酒吧而且能够遇见对方,久而久之便会由陌生人变成朋友,那么在这种情况下,便会由零散的个体变成一个大的群体,而这个整体中又会分支出小团体,而且这些小团体中的人,有一部分会占据主导地位,另一部分人会处在服从地位。这就意味着团体中的每个人的决策都会受到他人的影响。

枪手博弈是指,枪手甲乙丙三人相互怨恨,以决斗的形式进行一场博弈。

后来,人们在他的这种研究之上发现了“神奇的60%客满率”定理,即当人们选择去酒吧时,最初的观察结果并未找到任何规律,但是通过长时间的观察发现,每次去酒吧的人数和不去酒吧的人数之比接近60:40。尽管这些人中的任何一个人都不能归属到经常去或者不去的行列中,但是不论这些人是否去,去酒吧的人数整体的比例基本上是保持不变的。但是人并不总能保持理性,当人们在第一次去酒吧时,若发现酒吧人数非常多,那么这种现象会成为他们下次选择的一个参考,他们会认为酒吧人数太多、十分拥挤、喧闹,但是少数人可能会选择去酒吧,这时他们发现酒吧的人数并不多,然后便会在下一次叫上自己的朋友一起去酒吧,由此一来循环便正式开始了。

其中,甲的枪法最准,十发八中(命中率80%)。乙的枪法在甲之下,屈居第二,也能有十发六中的成绩(命中率60%)。丙的枪法最差,只能十发四中(命中率40%)。假设在三人都了解彼此实力并能理性判断的情况下,会出现以下两种情况:一,三人同时开枪,谁活下来的可能最大?

假设每个想要去酒吧的人都是理性的,那么酒吧每天接待的人数几乎不会有过大的浮动。但是每个人都不是理性的。

二,若由丙开第一枪,随后轮流开枪,他会如何选择?

其实这些喜欢去酒吧的人,往往会受上一次酒吧人数的影响,进而产生一些人数上的浮动,久而久之便会形成一种持续性波动的情况。这是由切斯特·艾伦·阿瑟博士提出的,他的理论如下:

第一种情况:

假设有100个人都喜欢去酒吧消遣娱乐,而酒吧的座位是有限的,这就说明这100个人在周末时都会考虑究竟是去酒吧还是待在家中,假设所有的人都选择周末去酒吧,那么去酒吧的人就会感到不舒服,而这时他们会觉得待在家中要比去酒吧更好。若我们设定酒吧的座位数是60,恰好在周末的时候酒吧座无虚席,那么想要去酒吧的人便会有两种决策:一种是不去,待在家中,另外一种是去。那么,这100个喜欢去酒吧的人最终将会做何选择呢?

第一轮:

酒吧博弈是在博弈论的基础上发展起来的一个博弈理论模型,简单来说这个理论模型如下。

甲:最佳的策略是先对准乙,因为乙的枪法比丙好。

酒吧博弈

乙:最佳的策略是先对准甲,因为三人中甲的枪法最准,这样,在乙丙两人中,乙活下来的概率更大。

按照这种决策的选择情况进行推断,可以得出若是在进行博弈的第一步时A便选择了不合作,那么A和B所获得的最终收益都是1,这样的选择远远小于A选择合作时的收益。

丙:同样也会先解决枪法最准的甲,干掉甲后再考虑如何应对乙。

在这种情况下,即根据理性人的假定结果,B会选择不合作。但是从此次博弈的次数和顺序来看,是需要经过第99次选择,才是B进行第100次选择,若是A在第99次选择中,考虑到B有可能会选择不合作的情况,那么他的收益将会是98,而且小于B在选择合作时的收益,此时当博弈进行到第99次时,A的最优决策是选择不合作,因为这样的选择能够让他获得99的收益,要比选择合作时的收益高……

现在我们可以分别计算三人活下来的概率。

通过这个策略选择图,我们能够发现蜈蚣博弈有一个极为特殊的地方:参与者A在进行决策时,他会考虑到此次决策的最后一次选择,即第100次选择;但是参与者B在进行决策时,会考虑第100次选择究竟是合作还是不合作,假设B选择合作那么他将获得100的收益,若是他选择不合作,则会带给他101的收益。

甲活:即乙和丙都未命中。乙的命中率为60%,那么未命中概率就为40%,丙的未命中率为60%。因此两人都射偏的概率为:40%×60%,所以甲活下来的概率为24%。

其实,正是因为这个博弈的形状像极了蜈蚣,所以才被称为蜈蚣博弈。

乙活:即甲射偏。甲有20%的未命中率,就相当于乙的存活率为20%。

那么,在此前提条件下,A与B又会做出何种决策呢?

丙活:根据上面的分析,在这一种情况下,没有任何人对准丙,因此丙最有可能活下来,他的存活概率为100%。

ABABAB(98,101)

由此我们可以看到,在这一轮的决斗中,丙枪法最差但活下来的概率却最大。而甲和乙的枪法都远大于丙,存活率却都比丙低。当然,导致这种结果的前提条件是三人都了解彼此的实力。但我们都清楚,在现实生活中,这样理想的前提条件很难满足,难免会因为信息不对等而产生其他的结果。若甲选择隐藏自己的实力,营造一个枪法最差的假象,那么此时甲的存活概率就会大大提升。

合作合作合作合作……合作不合作

第二轮:

ABABAB(100,100)

第一轮过后,若甲乙中有一方打偏,那么丙既有可能面对甲也有可能面对乙,若都打偏,那丙将同时面对甲乙两人,或者甲乙皆死。

合作合作合作合作……合作合作

如果丙只面对甲或乙,那丙的存活率最低。

蜈蚣博弈的提出者是罗森塞尔,它指的是这样一个简单的博弈,即参与博弈的两个人,分别命名为A和B,提供给他们的策略只有建立“合作”,或者拒绝“合作”(或者称为背叛)这两种可供选择的策略。若我们令A先做出选择,然后再由B做出选择,再轮到A做出选择……由此循环往复。我们设定A与B之间的博弈次数是有限的,即100次。假设此次博弈双方的支付给定如下:

如果同时面对甲乙两人,则返回第一轮的场景。

蜈蚣博弈

如果甲乙皆死,那么无疑丙最终存活。

简单概括一下猎鹿模型,当这两个猎人中的任何一个人有足够的信心确定对方一定会捕捉鹿时,那么最好的捕猎策略就是去捕捉鹿,在这种情形下没有任何理由去捕捉兔子。除非这个猎人没有足够的信心,不确定另一个人的做法。这就是信心博弈,但是两个猎人都会面临极大的信任危机。所以便会出现两个纳什均衡点,简单来说就是两种不同的结果,而这种结果无法用纳什均衡点进行衡量。

第二种情况:

显而易见,两个猎人建立合作获得的最终收益远远超过单独行动的利益,但是这便需要两个猎人在合作的过程中,个人的能力和付出是相等的。假设两个人中的任何一个人捕猎能力较强,那么他便会要求分得更多的利益,同时这会使另外一个猎人考虑到自身的利益,而不愿意参加合作。虽然我们都非常清楚合作双赢的目标,但是考虑到实际情况时,原因便十分明显了。若想在博弈中建立合作,便需要参与博弈的双方主动学会与对手建立良好的共赢关系,在保证自身利益的同时,也要考虑对方的利益。

由丙先开第一枪,那么可能如下:

由此一来,这两个猎人的行动策略就会产生两种博弈结局:第一种就是单独行动,不建立合作,那么每个人可以获得4只兔子;第二种是建立合作,共同外出捕鹿,则会获得1只鹿,保证两个猎人10天不用外出捕猎。因此,在这两种情况下便会出现两个纳什均衡点,即两个猎人单独行动,每个人获得4只兔子,并且每人能够吃饱4天;或者两个猎人建立合作,那么每个人可以吃饱10天。

丙射中甲:乙与丙对决,且只能由乙先开枪,丙会处于不利位置。

猎鹿博弈源自一则故事,即在古代的一座村庄里,住着两个猎人。而这个村子里主要有两种猎物:鹿和兔子。假设一个猎人单独外出捕猎,只能捕到4只兔子;然而,如果两个猎人同时出动且合作就能捕到1只鹿。而站在填饱肚子的角度看,他所捕到的这4只兔子能够成为他4天的食物,但是1只鹿足以让他在10天内都不用外出捕猎。

丙射中乙:同上,甲的命中率最高,丙的处境会更糟。

猎鹿博弈,最早出现在法国启蒙思想家卢梭的《论人类不平等的起源和基础》一书中,它又称为安全博弈、协调博弈,或者猎鹿模型。

丙都未射中的话:甲乙都不会选择先射击丙,而是会在甲乙双方之间一决胜负,直至其中一人死亡,而这时就会又轮到丙。可以这样说,只要丙谁都不打中,在接下来的对决中他就处于相对而言最有利的位置。

猎鹿博弈

警察与小偷博弈

其实,斗鸡博弈除了纯策略外,还包含混合策略均衡,即参与者的所有选择都是随机的,可能是进,也可能是退。但是,我们对于这类博弈更加关注它的纯策略均衡。任何一个博弈,若只有一个纳什均衡点,那么我们便能够轻易地预测出此博弈的结果,因为这个纳什均衡点就是已知的博弈的结果。反之,当一个博弈有多个纳什均衡点时,想要对博弈的结果做出预测,便需要我们了解其中的所有细节信息,诸如参与者究竟是哪一方选择了进,哪一方选择了退。根据这些额外的信息,我们才能对博弈结果做出判断。

在某个小镇上只有一名警察,整个小镇的治安全部由他负责。此时,我们假设这个小镇上的一头有一家银行,而小镇的另一头有一个酒馆;若这个小镇上只有一名小偷,那么由于他不具备分身术,所以当这个小镇上的警察在小镇的一头巡视时,小偷只能去小镇的另一头采取他的偷盗行动。

事实上,在这个博弈中,参与博弈的双方都是平等的主体,假设双方都选择主动行动,便相当于通知对方自身已经处在给对方最后的通牒,甚至可以说是相互威胁的状态。此博弈包含了两个纯策略的纳什均衡原理,即其中的一方选择主动前进,另一方则会后退;或者其中的一方选择后退,而另一方主动前进。只是在这两种决策中,我们不清楚哪一方会选择进或者退,简言之,双方的选择都是随机的,其中的所有选择背后的风险都是无法预料的。

假想一下,当小镇的警察正好在小偷采取行动的地方巡视,便能不费吹灰之力地抓住小偷;若是小镇的警察的巡视方向恰好与小偷采取偷盗行为的方向相反,那么小偷便能在不被警察抓到的情况下成功偷盗。

假设我们设定一个情景,即两个人狭路相逢。若是其中的一人想要主动行动,攻击对方,而另外一方则选择后退让路,在这种情况下,选择主动行动的一方便会获得胜利,即获得最大的收益。若是双方都选择退让,那么可以称为平局;若是自己一直主动出击,但是对方选择了退让,那么最后的获胜者就是自己,对方则成为失败的一方。还有一种情况就是,双方都选择前进,结果便是两败俱伤。相较这些不同的选择来看,最好的结果便是双方都选择退让,既不会两败俱伤,又不会让其中的某一方丢了颜面。

此时,我们设定此小镇上的银行中需要保护财产的金额为2万元,而小镇的酒馆中需要保护的金额只有1万元。那么,警察应该如何采取巡视行动,才能将小镇的损失降低到最小呢?

斗鸡博弈(Chicken Game)这个名词其实是一种翻译失误的产物,在美国口语中Chicken的释义代表了“懦夫”,因此,它应该是“懦夫博弈”,但是这种音译的失误并不影响我们对它的理解。

警察最好的做法是利用抽签的方式决定去小镇的银行还是酒店。由于小镇银行中所需保护的财产是酒馆的两倍,因此用1、2号两个签表示小镇的银行,用3号签表示酒馆,这样一来,警察去银行巡视的机会将达到2/3,而去酒馆巡视的机会将是1/3。

斗鸡博弈

在小镇警察的此种策略下,小偷的占优策略则要与警察相反,同样采用抽签的方式,与警察不同的是小偷用1、2号签表示去酒馆行动,而用3号签表示去银行,由此一来,小偷去酒馆行动的概率是2/3,而去银行的概率仅有1/3。

智猪博弈告诉人们,当在博弈赛局中处于弱势的一方时,应该学会选择这种等待的占优策略。不论是在竞争中,还是博弈中,参与的双方都在绞尽脑汁让自己获得最大的收益,但是这也暴露了一个问题,假设对方与你具有同样的理性和智慧,那么他是否会选择和你同样的做法呢?其实,博弈就是一场斗智斗勇的竞争。

在此前提下,即警察和小偷都是选择最佳占优策略时,我们将会获得一个十分有趣的结果,即警察和小偷成功的概率是相等的。(此处略去计算过程)

我们可以将小猪的这种方法称为“坐船”,或者“搭便车”,暗示人们在某些情况下,若是选择注意等待时机,将是一种明智之举,即,不为才能有所为。

事实上,警察与小偷的博弈需要有双方一种混合型的策略和思路。简单来说,警察和小偷博弈与我们生活中经常玩的“剪刀、石头、布”游戏更加相似。在这种游戏中,并不存在纳什均衡,因为参与此游戏的每个人出“剪刀”“石头”“布”的情况都是随机的,而且游戏的参与者不会让对方推断出自己的策略,甚至自己在此游戏中的策略倾向性。因为,当对方了解到自己的策略倾向时,自己便会面临极大的输掉游戏的风险。

若是小猪选择按投食开关,大猪在猪槽边等待,那么当小猪达到猪槽边时,大猪已经吃下了9个单位的猪食,小猪只能获得一个单位的猪食,所以小猪最终的收益明显小于它选择行动的成本,这样计算得出小猪最后的净收益为(-1)单位的猪食。假设大猪也选择在猪槽边等待,那么小猪的纯收益将为0,而且小猪选择等待的成本也是0。由此看来,不论大猪是选择主动行动还是等待,小猪都选择等待的收益要高于选择行动所获得的利益,这便是小猪在此次博弈中的占优策略。

其实,透过警察与小偷博弈中的混合策略均衡,可以看出博弈中的每个参与者并不会太过在意自己所做出的决策。实际上,当我们需要采取混合策略时,便要找到自己所要做出的策略方法,并且要让对手觉得你所做出的策略不会影响到他们。

其实,小猪选择在猪槽边等待,让大猪去按下食物投放按钮的答案一目了然。即当大猪去按下按钮时,小猪在猪槽边会获得4个单位的猪食,当大猪走到猪槽边时看似还有6个单位的猪食,实际上扣除按按钮所需要的2个单位的猪食,大猪最终得到的只有4个单位的猪食;若是小猪和大猪同时出发,同时到达猪槽,那么它们所获得猪食的比例为1:5。

这种方式似乎非常混沌,但它是前面所讲到的零和博弈的另一种随机转换。因为它要求参与者必须时刻保持警惕,稍微发现对方有违反规则的行动,便需要立刻采取决策并实施行动。若是对方的确做出了某种较为糟糕的行动,那便说明他们选择了最“愚蠢”的策略。

智猪博弈是纳什理论中的一个经典例子,它是在20世纪50年代由约翰·纳什提出的。若一个猪圈里有一头大猪,还有一头小猪,在猪圈的一边有一个投放饲料的猪槽,与猪槽相对的另外一边则安放着一个可以控制猪槽投食量的按钮,假设我们按一下这个投食按钮,猪槽内便会出现10个单位的猪食,但是想要按这个按钮,则需要拿出2个单位的猪食作为成本。在此种情况下,假设大猪先走到猪槽边,它跟小猪的进食量之比为9:1;假设大猪和小猪同时到达猪槽,它们的进食量之比则为7:3;若是小猪先走到猪槽,那么它们的进食量之比则为6:4。最后,若是两头猪都非常有智慧,那么小猪便会在猪槽边等待着。

在警察和小偷的博弈中,不论是选择了混合还是随机的策略,都不代表参与者在做出行动时是盲目选择。这其中仍然包含着很强的策略性,博弈取胜的要点在于运用其中的偶然性,针对对方是否发现你的某些策略性行为做出及时应对,进而保证自己成功的概率。

智猪博弈

海盗分金

现实中,那些执法机构并不会用这种博弈的形式诱导罪犯说出作案的信息,主要是由于罪犯不仅会考虑自身的利益,他们还会考虑其他的因素,比如揭发对方之后,很有可能会遭到不同形式的报复,而且他们无法将那些执法者所设定的利益作为自己是否揭发对方的考量标准。

有五个海盗(记为1、2、3、4、5号)掠得一百枚金币,决定以抽签的方式依次提出分金方案,并由五人共同表决。要想通过方案,必须有超半数的人同意才可以,否则这个人将会被扔进大海。这其实是一个博弈的过程,在分金的过程中,要想不被扔入大海,必须充分考虑其他人的利益,从而以最小的代价获取最大的收益。假设五个海盗都聪明绝顶并有足够理智的判断力,那么该如何进行博弈过程呢?

在囚徒困境中,所有的囚徒虽然选择了合作,而且不会向警察或者法官说出事实,还能为其他人带来利益,让所有人都无罪。但是当对方的合作意图并不是非常明显,或者无法确认时,出卖自己的同伙便能够让自己减刑或者立即释放,而且同伙可能也会为了自身的利益而招供出自己,在这种情况下,出卖自己的同伙是能够让自身的利益最大化的。

与其从前往后一个一个地想每个人会怎样选择,不如先把问题简单化,若只剩下最后两人的话,他们会怎么做呢?倒推来看,若1、2、3号都被投入海中,那么5号必定反对4号把一百枚金币全部收入囊中。因此往前推理,4号只有同意3号的方案才有可能保命。

事实上,囚徒困境仅发生一次和多次的结果是不同的。假设囚徒困境是重复进行的,那么博弈便会在其中不断重复进行,这时所有的参与者都可以做出决策去“惩罚”前面那些不愿意参与到合作中的人,在这种情况下,便会产生所有的参与者想要合作的局面。那些参与此次重复博弈的人,便会主动放弃自身欺骗的动机或者行为,导致所有的参与者的决策都向合作靠拢,最终经过反复博弈后,所有的参与者极有可能从最初的互相猜忌转变为相互信任。

3号猜到这一点,就会采取(100、0、0)的分金方案,因为他清楚地知道即便4号一枚金币也分不到,也仍然会同意他的方案。

简言之,当两个共谋犯同时被抓捕入狱,而且不能互相交流时,若是这两个人互不揭发对方,便会由于无法找到确切的证据,并且根据实际情况对两人判处同样的罪行,假设会判刑1年。但是,若其中的一方选择揭发对方的罪行,但是另外一方选择沉默,法官可能会将揭发者从轻处置,或者出于揭发者提供的证据,将揭发者利益释放,而沉默的一方则会由于不配合警方的调查、揭发者提供的确凿信息随即立案,被判处10年。还有一种情况便是共谋犯互相揭发、指证,那么便会提供完整的证据,最后双方都判刑8年。最终的结果往往更加偏向于最后一种,即由于无法交流、互不信任,最后互相揭发。这种情况,恰好印证了约翰·纳什的非合作博弈理论。

2号猜到3号的策略,就会采取(98、0、1、1)的方案,因为2号只要稍微照顾到4、5号的利益,4、5号就会向他投赞成票,而不希望2号出局让3号分配。因此2号最终会获得98枚金币。

20世纪50年代,囚徒困境首次被美国的梅里尔·弗勒德和梅尔文·德雷希尔提出,并拟定了相关困境的理论。随后,美国兰德公司的顾问艾伯特·塔克正式用“囚徒”的形式将其表述出来,而且正式命名为“囚徒困境”。

1号同样猜到2号的意图,就会采取(97、0、1、2、0)或者(97、0、1、0、2)的方案。对于1号来说,只要放弃2号,再分给3号一枚金币,给4号或5号两枚金币,这样他就可以得到三票,顺利通过方案拿到97枚金币。

囚徒困境是博弈论和非零和博弈中最经典的一个例子,它表示在某种情况下,那些有利于个人利益的选择,相对于团体而言并非有益处。简单来说,囚徒困境就是两个被捕的囚徒之间所进行的一场特殊博弈。当这两个囚徒想要建立合作、互相帮助时,便能够让双方获得利益,同时想要保持这种合作也是十分困难的。这种困难看似只是一种模型,实际上在我们的生活中也有很多鲜活的例子,诸如价格的竞争、环境保护,甚至是我们所面临的社交问题,都存在着不同程度的“囚徒困境”。

当然,以上的分析是建立在一个理想状态上的,即海盗都很聪明并且可以理智分析。而在现实生活中,情况就和模型相去甚远了。

囚徒困境

首先,假设3号、4号或者5号有一人没能猜到其他海盗的方案,那么1号被投入海中的概率则大得多了。或者只要1号提出方案,2号就许诺分配给其他人的金币比1号多一枚,这样一来,2号就成了最大赢家。

重复博弈所出现的选择的结果,清晰地解释了实际生活中出现的现象。然而,重复博弈中信息的完整性,能够影响博弈的最终结果的主要原因是,当参与博弈的人自身的所有信息都不被他人所了解时,那么他能够在整个重复博弈的过程中建立良好的声誉,借此他极有可能获得长远的利益。

这是在规则确定的情况下,但只要剩下的四人确定一个分配的新规则,将把握先机的1号先干掉,而后平分一百枚金币,所得的利益会较之前更多。因此,在现实生活中,规则意识的重要性就显得尤为突出了。

其实,影响重复博弈最终结果的因素,主要是重复博弈所进行的次数以及信息的完整性。在重复博弈中,所有的参与者受到长期利益和短期利益的影响,因此他们可能会优先考虑这两者哪个收益更高,从而做出一些带有舍弃性的决策。

如果我们扩大参加博弈的局中人数,同样是一百枚金币,由十个人来分配(记为1、2、3,……,10号),有50%以上的同意票才可通过方案,否则将被投入海中。

事实上,可以将重复博弈总结成三个基础特征:第一,在进行重复博弈的过程中并没有“物质”上的关联,简言之就是上一个阶段所进行的博弈,并不会改变接下来所要进行的博弈结构。第二,在进行重复博弈的每个阶段,所有的参与者都能够看到前面的参与者所做出的决策。第三,对于参与重复博弈的参与者而言,他们所获得的收益是在每个阶段所获得收益的加权平均数。

推理过程同上,倒推如果只剩下9号和10号,那么无论两人提出什么样的方案,按照规则都将被通过。现在把8号考虑进来,8号知道最后剩下两人的结果,那他会选择让步,只要拿出一枚金币来团结10号,他的方案就会通过,因为8号知道,只剩9号和10号时,10号会一无所得,因此10号是他理想的团结对象。因此,8号的方案就是(99、0、1)。再把7号考虑进来,既然关键在于50%,那么他只要再拉一人同意即可。那么此时,9号就成了他的最佳团结人选,7号清楚地知道,如果让接下来的8号分配,那么9号一枚金币也拿不到。因此7号笃定9号会支持他。以此类推,6号也会进行同样的推理,他会给在7号方案中得不到金币的8号和10号各一枚金币,来取得他们的同意票。由此,6号的方案就成了(98、0、1、0、1)。

在一次重复博弈中所有的前提条件都是相同的,但是重复博弈脱离不了最终利益的影响,因此,在进行重复博弈的过程中,所有的参与者在进行决策时,更多的会考虑到自身的选择是否会影响到博弈进行到最后阶段的抗争、压力,甚至是出现恶性竞争,简单来说就是重复博弈不能像静态博弈那样只考虑自身或者当前的利益,而丝毫不顾及其他博弈方的利益。某种情况下,当参与重复博弈中的一方表现出合作倾向时,其他的参与者也会在接下来的决策行动中选择与其合作的态度,进而帮助双方达成长期获利的合作。

综上,推理到1号时,他的方案会是(96、0、1、0、1、0、1、0、1、0)。

事实上,当所有的博弈仅仅进行一次时,人们往往更加关心它的最终结果;假设博弈会重复进行多次,那么人们的注意力将会变成最终的收益,甚至会舍弃眼前的利益,只为获得更加长远的利益,进而根据情况做出不同的策略选择。由此一来,重复博弈的结果便会取决于博弈所进行的总次数,而这个总次数又会影响到最终博弈均衡的结果。

原本最有可能出局的1号却可以抢占先机获得最多的金币,而10号相比最安全,却也只是能刚刚保住性命罢了。

重复博弈是“态博弈”的主要内容,一方面它包含完全信息(即掌握了某种环境或者状态下的全部信息)的重复博弈,另一方面它还包含不完全信息(即没有掌握在某种情况或者环境下的所有信息)的重复博弈。

我们再改变一下规则,前提不变,即所有的海盗都无比聪明并且可以保持理性。条件不变,五人分金,共一百枚金币,且同意的人数不少于一半时方案才可通过。

重复博弈是博弈论中比较特殊的博弈。重复博弈,顾名思义就是将同种赛局或者结构不断进行重复,甚至无限次进行重复,而重复博弈中的每次博弈被称为“段博弈”简单来说,就是参与“段博弈”的每个人都有随时采取行动的可能性,也有可能不会同时采取实际行动。在这个过程中,前面的局中人的所有实际行为是可以被后面的参与者看到的,所以,在重复博弈的赛局中,每个局中人的行动和策略,都会不同程度地受到前面的参与者的决策的影响,甚至可以说每个局中人的选择都会依赖其他参与者的行为。

海盗们通过抽签确定自己的号码,推理方法同上。

重复博弈

首先,只剩下4号和5号时,4号的方案就已经成为最终方案,因为无论5号同意与否,方案都可以被通过。此时4号的方案必定是(100、0)。

虽然能够通过有效的合作或者谈判达到双方皆大欢喜的结果,但是从零和博弈游戏走向双赢是一个比较复杂的过程,不仅需要参与竞争的双方真诚合作,还需要遵守整个“戏”规则,才有可能出现双赢的局面,若是不遵守这种规则,最后承担风险的还是参与者自身。

而5号因为在4号的方案中一枚金币也得不到,所以,只要在4号之前的人分给他的金币大于0,5号就会投出同意票。

其实,不论是个人,还是国家,都在这个世界中进行着一场盛大的零和博弈游戏。零和博弈理论认为,世界是一个封闭的空间,里面的所有机遇、财富、资源等都是有限的,当世界中的某个地区或者国家的财富或者资源增加时,也就意味着别的地区或者国家的财富或者资源在减少,这便像一种无形的掠夺。当我们对稀有资源进行大肆开采时,留给后人的就会越来越少……

对于4号来说,如果3号使5号获益,那么4号就会一无所得,因此他会让2号的方案通过,只要2号许诺给他大于0的收益。

事实上,早在2000多年以前,零和游戏便被广泛应用于输赢明显的竞争或者对抗中。后来,“零和游戏”受到了更多的关注,因为人们逐渐认识到实际生活中有很多与“零和游戏”十分相似的局面。与之相对的便是我们经常倡导的“双赢”,能够在某种程度上保证双方达成“利己”但不“损人”,并且通过双方建立合作、有效的谈判达到令双方满意的结果。当下,由于零和游戏的胜利者背后隐藏着失败者的辛酸和痛苦,所以零和博弈正逐渐被“双赢”所取代。

到了3号这里,如果2号给4号一枚金币,那么2号的方案就会顺利通过,3号也就没有任何收益了。因此,3号会考虑到1号的方案,只要1号的方案里有3号大于0的收益,那么1号的方案就会通过,自己也不至于落得连一枚金币也拿不到的境地。

因此,零和博弈属于非合作博弈。即参与博弈赛局的双方,在严格遵守博弈规则的前提条件下,若是其中一方可以获得利益,也就意味着另一方的利益必然受损。所以,博弈双方的收益和损失之和永远为零,即博弈双方不存在合作的可能。

那么2号呢?因为只要有50%的同意票,他的方案就会通过,所以他的方案会是(99、0、1、0),以此来实现利益最大化,所以无论1号是什么方案他都不会投出同意票。

零和博弈,作为博弈论中的一个概念,又称为零和游戏。生活中,下棋、扑克、乒乓球等比赛都属于零和游戏。我们可以将博弈看作两个人在下棋,不论是象棋还是围棋,在绝大多数情况下,其中的参与者总会有输有赢。假设我们提前设定好赢的一方可以获得1分,而输的一方自然要扣掉1分,即(-1)。在此情况下,双方的得分便是1+(-1)=0。这便是零和博弈最通俗的概述,一方输另一方赢,那么整个游戏的总成绩便是0。

最后剩下1号,如他所想,2号的同意票是注定失去的,而他只给3号、5号各一枚金币就可以拿到两人的同意票,所以最终他的方案会是(98、0、1、0、1),获得自己的最大利益即98枚金币。

零和博弈