张蒙老师的这篇文章分析得十分详实,用双重差分DID的这么一种研究方法,从多个维度去证明了lockdown的这个政策啊,对这个贸易,出口的负面效应。
我想从三个方面来点评这篇文章,
一个是方法的维度,本文用的DID,双重差分。作为政策效应评估的一种常用方法,双重差分法受到受到大家关注,一个是它可以很大程度上避免内生性问题的困扰:政策相对于微观经济主体而言一般是外生的,因而不存在逆向因果问题。DID估计的本质就是面板数据固定效应估计,使用固定效应估计一定程度上也缓解了遗漏变量偏误问题。第二,传统方法下评估政策效应,主要是通过设置一个政策发生与否的虚拟变量然后进行回归,相较而言,双重差分法的模型设置更加科学,能更加准确地估计出政策效应。
DID的基本思想就是通过对政策实施前后对照组和处理组之间差异的比较构造出反映政策效果的双重差分统计量,这个时候只需要关注模型中交互项的系数,就得到了想要的DID下的政策净效应。从DID的模型设置来看,要想使用DID必须满足以下两个关键条件:一是必须存在一个具有试点性质的政策冲击,这样才能找到处理组和对照组,那种一次性全铺开的政策并不适用于DID分析,本次疫情封锁的分析就符合,因为它开始是武汉封锁,再湖北一些其他地市封锁,再是其他地区;二是必须具有一个相应的跨越政策实施前后的时间维度的面板数据集,这个时间不能太短,本文用的是2018年1月到2020年4月,是符合的。
二个是数据的维度丰富。本文有描述四个数据来源,一个是海关,国家海关总署也好还是地方海关也好,收集了大量的出口贸易数据,包括产品明目,出口国,交易量、交易额等等,这个数据量是相当大的,作者也说了8557种出口商品,还要统计成city-level的数据,而且地方海关和国家海关的统计口径还不一样,所以说难度非常大,作者一定是花费了不少的功夫去整理和处理这些数据。另外,作者还收集了city-level级的新冠病例数据、百度迁徙数据乃至气象数据,用于去作为控制变量也好,或者用于自变量的替代作为稳健性检验也好,目的都是为了一个,证明疫情封锁对出口有负向效应。
第三是实证的严谨性,很多人在做完DID模型设定和回归后,就没有后续了,很多人对这一点并不重视,认为DID很简单,随便跑几个回归就可以完事。但作者用了近乎非常严谨的稳健性检验来证明DID模型设定的鲁棒性,即必须证实所有的出口增长率的下降效应确实是由lockdown政策实施所导致的。
关于DID的稳健性检验,作者主要表现在两个方面:
一个是既有趋势的检验。也就是说实施了lockdown的处理组和没有实施lockdown的对照组在政策实施之前的趋势应该是相同的,作者倒推了政策实施前6个月的数据,发现DID系数是不显著的,基本证明这一点。
二个,即便处理组和对照组在政策实施之前的趋势相同,仍要担心是否同时发生了其他可能影响趋势变化的政策,也就是说,政策干预时点之后处理组和对照组趋势的变化,可能并不真正是由该政策导致的,而是同时期其他的政策导致的。这一问题可以概括为处理变量对产出变量作用机制的排他性,对此,可以进行安慰剂检验:
安慰剂检验,即通过虚构处理组进行回归,作者做了三种尝试,一个是选取湖北省相邻城市,一个是选择零病例城市,一个是随机选取城市,均发现DID的回归结果不显著,那就表明原有结果不太可能是受到其他潜在因素的驱动。
再补充说一点,有一点不太明白的地方,就是异质效应那里,5.2,作者从四个维度来阐述异质性,结果证明是city有更少的加工贸易、更多的远程工作、更多的信息基础设施、以及沿海城市会带来更好的应对供应链冲击的弹性从而lockdown对出口贸易的负向冲击会没那么大,那table2的结果的(1)和(2)列,应该是Low processing trade share的负值程度要小一些吧?
整体而言,论文模型设定合理、数据丰富、角度多样、实证严谨,用DID方法,全方位的向我们证明了lockdown政策对出口贸易的负面效应,是一篇不可多得的好文章。