第2章读后感:课程中的博弈
在第二章的学习中,我了解了博弈的组成要素——包括参与人、行动(即战略)、支付等,也学习了占优策略、纳什均衡等相关知识,但令我感触较深的,当属“智猪博弈”和“囚徒困境”。
一、智猪博弈——关于优化大学小组作业困境的一些想法
在众多博弈中,“智猪博弈”应该可以称得上最使当代大学生深有感触的博弈之一了。小组作业作为一种被戏称“反人性”的合作,常常被各路人士放置于某乎、某站等地抨击。抨击的点无外乎就是围绕着“搭便车”行为(即竞争中的弱者以等待作为自己的优势策略)展开。“搭便车”“抱大腿”等现象的发生,不仅仅给我们的大学生学习环境带来了严重的不良影响,有违社会公平,并且降低学生的学习积极性,甚至还会影响到彼此未来的感情。更进一步,“智猪博弈”并未体现合作双赢的策略思想,也造成了不必要的资源浪费。
但其实,学习完博弈论后,我们会发现,针对“智猪博弈”,也是有更好的解决办法的。
其实本质上,“智猪博弈”就是一个激励失效的典型案例。所以解决“智猪博弈”的困境,关键在于设立一个更为有效的激励机制。
从学生的角度看,我们应该有权利自主选择志同道合的同伴,具体来讲,都想拿高分的同学可在一个组从而创造出更大的效益,对自己要求较低的则可报团取暖。倘若是按照学号来分组,则大概率会出现团队成员能力参差不齐、成员之间存在着实力悬殊很大的现象,从而使得团队成员因为对目标要求的不一致而陷入精神内耗、影响合作效果。个人目标和组织目标、个人目标和个人目标之间存在偏差是很正常的现象,比如商业中的“委托-代理”问题。利用物理知识可知,一个平面上的物体,如果受制于不同方向的牵引力的作用,那么它可能一动不动——对应到合作上,就是合作毫无进展。因此,我们应该形成利益共同体,而通常,志同道合的人更倾向于成为“一条船上的蚂蚱”。
或者是,“大猪”可以寻找愿意配合自己做好事情的“中猪”。(*这似乎跳出了“智猪博弈”的范畴,但的确具有一定的实践意义,故记载于此。)有时候,小组内部会有一些“隐性”利益冲突,比如,一个小组只能派一名发言人进行展示且只给这一名发言人加额外的分,或是,小组长可以享受额外的优待。如果一个组里有两个“大猪”,在面对这种情况时,可能会略显尴尬。实际上我也是那么做的。在创新创业实训课程中,为了和志同道合的好友都尽可能达到利益最大化(争取额外加分),我们选择各自为战——她是风险投资负责人,我是制造公司的CEO。为了达成更好的合作效果,我选择了有相关平台操作经验的T同学、与我一同参加大创且责任心强的朋友以及她的舍友。她们与我并无直接的利益冲突,且都表示自己会好好干,在之后的课程中她们也的确是这样做的——愿意配合我,完成一次又一次的生产经营计划制定及修订、不辞辛劳地进行商业谈判和市场竞单等,在合理的分工与配合下,我们组自然是拿到了不错的成绩。成功的原因固然有很多,从我的角度看,首先,我让她们意识到我是“大猪”,且表示我不会浪费“组长”这一身份——提前阅读相关文件、积极进行任务安排、引导组员进行讨论以优化团队决策等,即展现出“领导力”;其次,我借鉴现代人才管理体系中的激励措施,为我的组员提供了“物质奖励”——我会隔三差五地给我的组员分享水果、零食等,一方面拉近了彼此的心理距离,另一方面,也给予了对她们“努力成果”的肯定。
从老师的角度看,设定更为科学的组队、评分机制尤其重要。比如,减少组员数量,尽可能减少“搭便车”行为,尽管有些能力超群且心善的“大猪”可能并不在意其余队员的贡献值,但这样的行为对于“抱大腿”的人而言,本身也是不利的——容易养成“等靠要”的懒汉习惯。论及评分机制,可以通过明确小组作业中各部分负责人的方式(做到权责清晰),按照各成员的贡献值给予不同成员不同的分值。除此之外,老师也可以适当给予大组长以打分权力,也就是企业界常说的“适当放权行为”,避免信息不对称造成的不公平现象发生。
二、囚徒博弈——关于实验经济学课堂实验的一些感想
在实验经济学的第一堂课,我们进行了两个“囚徒困境”实验。
在纸质版实验不允许沟通的 Round1,我并不知道我的博弈对手是谁,加上我们这个班正在学习博弈论,“囚徒困境”知识是我们的理性共识,所以对方和我都选择了出黑牌,即一开始就选择达到纳什均衡。而在允许沟通的 Round2,我惊讶地发现:我的博弈对手是我的朋友。尽管我们的关系并不算密切(且两人对于课堂活动存在相近的收益需求),但考虑到不远的将来,我们“抬头不见低头见”,且可能将来还是彼此的博弈对手,还有合作的空间,故在爽快的沟通和短暂的犹豫下,我们还是选择了都出红牌,实现了集体利益的最大化。进一步想,如果我的博弈对手是陌生的同学,则双方沟通无效、相互背叛的可能性会有些许提高,但真到了决策的时候,也可能因为于心不忍而最终达成了(红牌,红牌)的互利结果。其实,参与人是否决定合作,取决于长远利益是否抵得过眼前利益的诱惑,以及耐心程度的大小。倘若给定不合作带来的诱惑和合作带来的长远利益,如果未来越重要,那么双方合作的可能性就会越大。这也可以用来解释为什么稳定社会中的人比动乱社会中的人更值得信赖,以及为什么人们在法治社会中会比在人治社会中更有合作精神(因为与法治社会相比,人治社会具有更大的不确定性)。
在计算机版实验中,由于博弈次数大大增多(纸质版只有3轮,计算机版有15轮)且参与人身份未知,实验又出现了许多有意思的结果:有的“冷酷到底、拒不合作”,有的小心试探、中途达成共赢的默契后最后又变卦……无论如何,我们都需要承认并接受这一事实:信息沟通不通畅的时候,人们会因为信息不对称而怀疑对方,导致为了追求个人利益而牺牲集体利益,更深一步,耍小聪明的人在作茧自缚的同时很有可能毁了一个团队。通过数据分析,我们发现:多数小组最后的累计收益还是远超于使用“纳什均衡”得到的预期水平的,即多数同学还是选择了长期合作。虽然博弈次数有限,但若使用极限思想去思考,也能获得一定启发:在现实生活中,如果你给对方一个我们共事一定次数或者时间之后就再无往来了的印象,那么对方的最优策略就是背叛你;但如果你和对方都不知道你们在一起的终点在哪里,那么大多数理性的人就会选择合作、共赢。这样的结论性思考,无论是对于今后的同学合作,还是未来的职场生活,都是大有裨益的。
解决囚徒困境的出路不是否定个人理性,而是通过各种各样的制度设计(包括法律、奖惩制度等,例如税收制度可以保证公共产品的供给),达到个人理性与集体理性的统一,让人们认识到“未来”的重要性,从而实现社会合作。当然,爱也可以促进合作,无论是出于同学间的爱,还是对于陌生人的爱。
一言以蔽之,囚徒困境模型为我们提供了如何克服囚徒困境的思路。只有理解了人们为什么不合作,我们才能找到促进合作的有效途径。