“囚徒困境”是1950年美国兰德公司提出的理论,后来由顾问艾伯特·塔克以囚徒故事加以阐述,并命名为“囚徒困境”。
艾伯特·塔克的故事是这样的:
两个人因合伙盗窃杀人被捕,警方将他们隔离囚禁,并给他们三个选择:
1、如果两个人都抵赖,各判刑一年。
2、如果两个人都坦白,各判八年。
3、如果两个人中一个坦白而另一个抵赖,坦白的会被释放,抵赖的判刑十年。
于是,每个囚徒都面临着两种选择:坦白或抵赖。
很显然,最有利的选择是两个人都抵赖各判一年,但由于两个人处于隔离状态,不知道同伴会选择什么策略,但是,从最基本的人性出发,他们肯定会认为自己的同伴必然会选择对自己最有利的策略:坦白。
既然同伴被默认为坦白了,那么,自己抵赖就会被判十年,太亏了。于是自己也就会选择坦白,因为最坏也就判八年,运气好的话,还能被提前释放。
这样一来,为了防止最糟糕的情况出现(同伴坦白,自己抵赖),两个人只能放弃最优策略(同时抵赖),而选择了一个相对糟糕的策略(同时坦白)。
“囚徒困境”就是这样最大限度地衡量着人性。在这场博弈中,唯一可能达到的双方最优方案,就是双方同时放弃最优策略。
在这个困境博弈中,每个人都会自私的寻求个人的最大效益,因为每个人都相信其他人也都会自私的寻求个人最大效益,反而因此两败俱伤。
那么,有没有什么办法能破解“囚徒困境”呢?
在英国,有个广播公司BBC他们有个著名电视节目《金球》,节目开始有四名选手参加,然后淘汰到只剩两名选手来角逐一笔巨额奖金。
角逐环节是这样的:主持人给每个人两个球,其中一个写着“平分”,另一个写的“偷走”,两名选手需要从中选择一个球。
根据两个人的选择,会出现三种情况:
1、两个人都选择了“平分”,那就两个人平分全部大奖。
2、如果一个人选择“平分”而定,一个人选择“偷走”,那么选择“偷走”的人能拿走全部奖金,选择“平分”的人出局。
3、如果两个人都选择了“偷走”,那么两个人同时出局,一分钱都拿不到。
在做出各自的选择前,两个人可以互相商量,但是最后选择的时候,必须单独选择。
这是一个典型的囚徒博弈游戏,相当于两个人被捕前串供,但审讯时仍然隔离囚禁。
在这个规则下,常常出现这样的情况:其中的一个人信誓旦旦的保证说自己一定会选择“平分”,同时让对方也选择“平分”,这样两个人可以平分奖金。但事实上,最后要么就是他选择了“偷走”,真的偷走了全部奖金,要么就是两个人都选择了“偷走”,最后全部出局。
这个节目把囚徒困境玩到了极致,一直没有任何选手能够成功摆脱这种困境。
后来,一个叫尼克·凯瑞甘的选手成功打破了这种困境。
那期节目,杀入最后角逐的是尼克凯瑞甘和亚伯拉罕·海森。当时海森和以往几期的选手一样,向凯瑞甘保证自己一定会选择“平分”,并恳请凯瑞甘也选择“平分”。
但没想到的是,凯瑞甘鹊态度强硬的向海森表示,自己一定会选择“偷走”,但他同时表示,只要让他拿走全部奖金,他会在节目结束后再和海森平分这笔钱。
这种前所未有的情况,让主持人和现场观众大跌眼镜,海森更是气的直骂凯瑞甘“无耻”,但凯瑞甘丝毫不肯让步。
这样一来,海森就只剩下两种选择了:选择“偷走”,两个人都拿不到钱;选择“平分”,凯瑞甘拿走全部奖金,但是有可能会在节目结束后跟自己平分。在这种情况下,海森只能选择“平分”,至少还有可能拿到一半奖金,如果凯瑞甘守信用的话。
结果出人意料,海森选择了“平分”,而凯瑞甘并没有像他之前强硬宣称的那样选择“偷走”,他同样选择了“平分”。最后两个人平分了奖金,终于打破了节目组设下的这个人性困局。
“囚徒困境”,其实是利用了人性中的极度自私,在单次博弈中,逼的人不得不放弃最优解而去追求,避免最坏情况发生的次优解。
而它的破解之道也很简单,就是引入重复博弈,通俗的说,就是这次博弈结束后,博弈双方还将继续发生别的关系。
回到“囚徒困境”的最初场景,试想,如果两个罪犯背后还有个制度森严的犯罪组织,并且两个罪犯都知道,如果自己供出了同伴,将遭到严厉的报复(二次博弈),那么,即便是在“囚徒困境”之下,他也会义无反顾的选择抵赖。
同样的道理,在这《金球》节目中,凯瑞甘向海森承诺节目结束后平分奖金,也等于是将一个单次的博弈变成了重复博弈,从而使得囚徒困境失去了作用。