三重差分(DDD)是我非常喜欢的因果识别方法,因为它既可以在DD平行趋势可信的时候作为证伪分析的手段,也可以在DD平行趋势不可信的时候作为基准识别策略,见【应用计量系列131】不平行的DD,平行的DDD与stata应用、【CIMERS公开课】不平行的DD,平行的DDD。
虽然DD是因果效应评估中最常用的识别策略(Goldsmith-Pinkham P. Tracking the Credibility Revolution across Fields[J]. arxiv preprint arxiv:2405.20604, 2024.),但是它严重依赖于平行趋势假设。如果处理组的个体对一些时变的冲击有差异化的暴露情况,那么,处理组和控制组极有可能不满足平行趋势,例如,Xu W, Tang L, He E. Baby Boom[J]. Available at SSRN 4788180, 2023.。DDD估计量可以引入第二个DD来刻画这些差异化的冲击,从而应对DD平行趋势不成立的问题。更多的技术细节和应用参加【应用计量系列131】不平行的DD,平行的DDD与stata应用、【CIMERS公开课】不平行的DD,平行的DDD。
DDD研究设计利用了许多数据集中的共同结构性特征——个体可能属于多重重叠的子群体中,而这些子群体暴露在处理中的程度又存在差异,因此,它除了利用DD中处理的个体变动(variation)和时间变动外,还利用了第三个维度的变动信息来识别因果效应。
常用的TWFE DDD回归声明并没有直接检验DDD的识别策略,例如,彭飞,许文立,吕鹏,等.未预期的非税负担冲击:基于“营改增”的研究[J].经济研究,2020,55(11):67-83.,在营改增的非税负担环境中,用下列固定效应回归模型:
其中,是处理变量。
我们将理解成平均处理效应。在经典的2×2×2的两期、两层的处理组和控制组环境中,估计系数等价于处理组的平均处理效应的DDD估计量(Olden & Møen, 2020)。然而,理论上并不清楚上述估计在更一般的交叠处理情形下,有效识别的条件是什么。
我们现在已经知道了,在交叠处理情形下,即使平行趋势成立,TWFE估计量很有可能存在严重的偏误。Strezhnev A. Decomposing triple-differences regression under staggered adoption[J]. arxiv preprint arxiv:2307.02735, 2023.显示静态DDD回归估计量也可能存在类似的问题。
类似于Goodman-Bacon (2021)的分解,DDD估计量也可以分解成每个2×2×2项:
第一个差分是处理组和给定时期和层级下控制组个体的差分;
第二个差分是在两个个体具有相同的处理状态(要么都是未处理,要么都处理)的某个时期中,同层级的个体间结果差分。
这两个差分构成了主要的2×2 DDs。正如在TWFE DD下,“禁止”的控制组问题也会在第二个差分中出现。
- 第三个差分是主要2×2 DD项和安慰剂2×2 DD项的差分。安慰剂2×2 DD项是两个层级中的控制组的差分。它与主要2×2 DD项匹配。即使存在处理效应异质性,安慰剂2×2 DD项也是有效的,因为它们没有处理效应。
但是,当处理是交叠实施的,那么,安慰剂2×2 DD项也有可能由两个不同的层级下的处理组所组成的2×2比较(两个层级中个体的处理状态未发生改变)。这些安慰剂2×2 DD项就不再是有效的。因为此时,有一些主要2×2 DDs项也作为另一些2×2 DDs项的安慰剂2×2DD项了。
因此,DDD回归估计量在交叠处理下可能也存在偏误。
现存的异质性处理效应文献中,明确注意到“负权重”问题也出现在DDD中,且可以应用的估计量(stata命令)有BJS(Borusyak et al., 2023,did_imputation)、dCDH(did_multiplegt、did_multiplegt_dyn)、Wooldridge(2021,jwdid,wooldid)和堆叠DID(Xu W, Tang L, He E. Baby Boom[J]. Available at SSRN 4788180, 2023.)