本章节分三段核心内容:
- 原因的定义
- 怎样找到原因
- 为什么需要原因
-
原因的定义
一般指它使某种结果更有可能出现,并且没有它某种结果就不会出现或者无法出现,或者说它能够在适当的环境下产生某种结果。
原因的定义有很多种,但是没有一种是完全适用于所有问题的。
休谟认为原因在时间上早于结果,同时原因在空间上要相近于空间。但是往往有的原因和结果不具备相近性。
原因一般具备以下属性之一:- 时序性
- 时间临近性
- 空间临近性
-
怎样找到原因
现有方法:计算相关性
计算相关性的数据是否具备全面性。(案例:Facebook利用流量数据了解人们社交,但是,使用Facebook只是一部分人,想分析某种行为的原因不具备普遍性,其次就是虚假数据造成的误解。)
寻找原因的难点在于:- 变量不明确或者变量缺失
- 多变量复杂关系
- 一些偶然事件的因果查找
为什么寻找原因
更好的预测、解释和干预。
原因比起相关性会提供更为可靠的预测结果。