囚徒困境
合作与背叛的游戏
数学家艾伯特塔克在1950的讲演时,用两个个囚犯的故事将当时的一个博弈论问题做了形象的阐述,从此便有了“囚徒困境”的命名。
两人携枪作案被捕后,警方怀疑二人可能还有其他重罪,为了获取证据便分开囚禁,以便单独审讯。为了瓦解双方,于是给二人被告知:如果主动坦白,则可以从轻处罚;顽强抵抗的话,一旦同伙招供,你就要收到严惩;于是分别给两人的选项如下:
1、如果两人都不坦白,两人将仅仅会因为非法携带枪支各判刑1年;
2、其中一人招供,另一人不招,坦白着将被无罪释放,另一人被重判15年;
3、两人都招供,则各判10年;
在两人理性分析能力一致都前提下,各自都会关心如何让自己刑期减短,还要考虑到对方招不招供的风险;
分析
加入我是A,我的各种结局:
1,我招供,赌B不招供;我被释放;
2、我招供,B招供,则各获刑10年;
3、我不招供,赌B也不招供;我俩各获刑1年;
4、我不招供,B招供,我被判重型15年;
如果两人都不招供,虽然可以实现利益最大化,但相对的风险也高,一旦对方招了,沉默的一方就面临着最重的刑期;
如果想让自己刑期最短,被释放的前提是另一个人抵抗不招;但对方也会这样想;即使两人选择利益最大化的合作都不招,即能获刑最短刑期,但这不能避免对方临时变卦,因为直接被释放更有诱惑力;基于双方足够理性的前提,站在各自的角度来看,两人都会选择主动招供,因此被判10年的结局即被称作“非合作均衡”;
但这种均衡需要在两个人绝对理性的前提下选择最优,但实际往往实现不了,所以一般警察能赢;
但是在现实生活中,只要摒除了囚徒困境下的不通信息的弊端,就可以在知情的情况下做出有利于两方的选择,这也就是所谓的“串谋”
智猪博弈:搭便车最省力
不付成本坐享他人之力
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有一定单位的猪食进槽,两头隔得很远。假设两头猪都是理性的猪,也就是说他们都是能认识和实现自身利益的猪。再假设猪每次按动按钮都会有10个单位的饲料进入猪槽,但是并不是白白得到饲料的,猪按动按钮以及跑到食槽要付出的劳动会消耗相当于2个单位饲料的能量。此外,当一头猪按了按钮之后再跑回食槽的时候,它吃到的东西比另一头猪要少。也就是说,按按钮的猪不但要消耗2个单位饲料的能量,还比等待的那头猪吃得少。
分析
1、大猪去按按钮,小猪等待,大猪能吃到6份饲料,小猪4份,因为大猪跑去按按钮了因此消耗掉2份,最后大猪和小猪的收益为4∶4;
2、小猪去按按钮,大猪等待,大猪能吃到9份饲料,小猪1份,因为小猪跑去按按钮了因此消耗掉2份,最后大猪和小猪的收益为9∶-1;
3、若两头猪同时跑向按钮,那么大猪可以吃到7份饲料,而小猪可以吃到3份饲料,扣除两人各消耗的2份,最终收益为5∶1;
4、两头猪都不动,自然也吃不到东西,饿着,两者的收益就为0。
图示:
收益表:
对于小猪来说,主动劳动比躺在原地还要吃亏,因此站在小猪都立场,不劳动是最优的决策;
对于大猪来说,当得知小猪不会主动按按钮当时候,那2个选择中,如果等待,两者就都等死,主动去按钮,至少还能有4份饲料都收益;
结论就是,不管大猪采取什么样的策略,对于小猪来说劳动都是一个劣势策略,因此最开始就可以除掉这种可能。在剔除了小猪按按钮这种方案以后,大猪就只有两种方按可供选择。在这两种策略里面,等待是一种绝对的劣势策略,也被剔除掉。所以在剩下的策略里面就只剩下小猪等待、大猪按按钮这个可以供选择的策略了,这就是智猪博弈的最后均衡。