首先,这里所指的因果不是道德意义上的,比如做好人能否有好报等,而是理性认识的界限内的因果关系,科学意义上的因果,比如吸烟是否导致肺癌。
因果推断的意义
因果推断的重要性不言而喻,因为只有理解了事物发生的原因,才能够针对原因,施加干预,阻止或延缓其发生。
就像年初热播剧《开端》中那样,男主和女主只有真正找到了萌萌蒙冤是导致爆炸发生的原因,才能够进而查明萌萌死因真相,解开萌萌父母的心结,尝试阻止爆炸的发生。
现实中的例子,我们明白了血管紧张素是致血压升高原因之一,所以能采用血管紧张素抑制剂作为一种降压药来治疗高血压。但这也仅仅是对症治疗,真正的高血压的病因并未阐释清楚。
因果关系应该是张网络或者链条,也即因果网或因果链,一环扣一环。我们仅了解其中“血管紧张素升高→血压升高”这一个下游环节,便可以针对性地对血管紧张素型高血压予以血管紧张素抑制剂作为治疗手段,这是种进步。但仅了解这些还不足以让我们从源头上预防高血压,也即对因治疗。试想如果我们了解了更上游的导致高血压的原因,便能施加干预,就能起到上医治未病,预防疾病的效果。
流行病学就是这样一门与因果推断密切相关的学科,旨在研究人群中疾病与健康状况的分布及其影响因素,并研究和制定防制疾病、促进健康的策略和措施。
因果关系如此重要,也可能正因为如此,寻找因果关系的过程,也即因果推断才异常艰难。究其原因,我认为因果推断主要面临以下两大困境。
因果推断困境
语言的缺乏
不得不承认,在没读Judea Pearl的书之前,我不知道如何表示这样一个简单的论断:即感冒往往导致发烧,而发烧可能感冒,却不是感冒的原因。这个例子是Judea Pearl在书中提到过的。
每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。——奥古斯都·德·摩根(1864)
我对语言的强调也源于一个坚定的信念,即语言会塑造我们的思想。你无法回答一个你提不出来的问题,你也无法提出一个你的语言不能描述的问题。——Judea Pearl《The Book of Why》
方程
回想自然科学使用的数学语言,用的最多的就是方程。比如欧姆定律、胡克定律,等等。方程是一种等式,知道任意一边可以求解另一边,比如:根据胡克定律,知道了拉力我可以求解弹簧伸长量,反之亦然。
等号是没有方向的,方程抹掉了方向性,而因果是有方向的。因此方程不足以描述因果关系。
条件概率
另一种常用的数学语言是概率,条件概率应该是最可能用于描述因果关系的语言了,因为条件概率涵盖了两个变量。但高中时代学过的条件概率中P(A|B)与P(B|A)是没有明确区分的。这就好比,P(发烧|感冒)与P(感冒|发烧)具有对等的地位,还是体现不出因果的方向性。
再往深一点,真正的贝叶斯推断的条件概率公式应该从用证据(evidence,e)来更新我们对假设(Hypothesis,H)的信念的角度来理解。P(H|e)与P(e|H)有种将两个因素予以区分的意味了,然而贝叶斯公式似乎更关心的是左侧的P(H|e),也即由果(e)及因(H)的方面。但我们真正关心的应该是顺着因果方向,也即由因及果的方面,即P(e|H)。因此经典的条件概率还是不足以表示我们所研究的问题。
反事实
什么是反事实
什么是反事实(Counterfactual),举个例子,一个吸烟者得了肺癌。那么我们会问吸烟是导致他得肺癌的原因吗?如果假设该吸烟者不吸烟就不会得肺癌,那么我们有一定的理由相信吸烟是导致他的肺癌的原因。然而不幸的是,我们无法观察到他不吸烟的情形。 吸或者不吸,我们只能观察到事实的情形,另一个不能被实际观察到的假象的情形即为反事实。
当然,抛开反事实不说,个人差异较大,探究因果一般都是在人群层面,概率意义上探究的。
群体层面上,已知一群吸烟者肺癌的发病率为I_1,那么我们会问吸烟是导致肺癌的原因吗?注意这里只有一群人,如果假设这群人不吸烟的情形下,它们肺癌发病率为I_1’明显低于I_1,那么我们有理由相信吸烟可能导致肺癌。同样地,我们还是面临反事实的问题,这群人吸烟或者不吸烟,我们只能观察到情形之一。
研究某某政策的效果和影响时,比如社会学等研究,同样面临这样的问题。你想研究新冠对经济的影响,那得对比没有新冠的情形。
概括起来就是,反事实是我们想要对比的情形,然而我们确观测不到。
如果严格地从反事实的角度考虑,科学研究就无法进行了。科学就是讲证据,讲事实,但反事实永远是无法观测到的。
难道科学的根基就要因此而动摇了吗?当然没有。
反事实与可比性
对反事实的关注其实源自对可比性缺失的担忧。
自然科学的研究也是反事实的,还是以胡克定律为例,我们凭什么说拉力翻倍,伸长量也将翻倍。我们真正想对比的是那样一个世界,是在那个时刻的另一个反事实的世界,在反事实的世界里,拉力是现实世界的两倍,恰好观察到伸长量也是现实世界的两倍。
如果我们执意要坚持反事实的苛责要求,那么只能采用《开端》中不断进入"循环"的方式,或者平行宇宙的方式来进行科学研究了。这是不现实的。
我们没有观察到反事实的世界,但我们却得出了胡克定律的结论,原因在于我们找到了一个认可的对照。
我们再做了一次试验,让拉力翻倍,并认为这次试验能够代表当初想像的反事实的世界,加以比较,得出的胡克定律。
所以,反事实并不是什么新奇的事,自然科学的实验同样是反事实的。但为什么在流行病学和社会科学中,反事实问题如此突出,关键就在于我们找不到合适的对照。
一方面,从发生暴露到结局发生的时间跨度长,这期间种种因素对两组人群的可比性造成威胁,另一方面,不像经典的物理学面对的多是自在或人造之物,人对这些物有很强的可操作性。而流行病学面对的是人群,社会学可能想探讨某某政策的效果。我们对人的行为,以及政策等往往没有足够的可操作性。这两点决定了很难找到合适的对照,这便是此类研究中反事实问题如此突出的原因。
综上,语言的缺乏和反事实是因果推断面临的两大困境。
因果革命
相关不等于因果的观念早已深入人心。但我们关心的始终是因果的,因果关系是更牢固的,相关只不过是我们探究因果的手段而已。
因果长期被视为统计学的禁忌,也难怪长期以来没有形成描述因果关系的数学语言。
幸运的是,近30余年,因果推断迎来了新的机遇。Donald Rubin发展了潜在因果模型。Judea Pearl发展了因果图模型。Rubin的潜在因果模型我了解不多。但读Judea Pearl的书确实解答了我很多的疑惑。
Directed Acyclic Graph(有向无环图)的引入解决了用图来表示因果关系的问题。Directed代表有方向的,这是适合因果关系的语言。Do-calculus(do 算子)的引入让我们能够想象反事实的假想世界,在其中进行模拟干预,评估效果。
读完Judea Pearl的书后,我至少能够表示“感冒能导致发烧,发烧却不是感冒原因”这样的命题了。
很多人称这场变革为“因果革命”。
就刷新认知的意义上,于我而言,她的确值得“革命”这个词。
如果你也对因果推断感兴趣,欢迎在留言区一起讨论。