【应用计量系列110】标准误哪家强,stata命令找金兰(MacKinnon)

参考文献:MacKinnon, J.G., Nielsen, M.Ø., Webb, M.D., 2023c. Leverage, influence, and the Jackknife in Clustered Regression Models: Reliable Inference Using Summclust. Stata Journal (accepted).

金兰(2023a,b,c)等今年算是把回归中的聚类标准误给大家说明白了。前两篇文章已经在JoE上发表了,后一篇文章被stata接收。

现在,经济学和其他学科的经验研究都用聚类稳健标准误来对线性回归系数做推断。一般来说,N个观测样本会分别被配置(划分)到G个聚类组群中,例如,家庭、学校、村庄、地区、行业、年份、国家等等。样本配置到聚类的机制通常是已知的,不同聚类中的观测样本假设是独立的,但是聚类内部的样本之间允许异方差,或者相互依赖。在这些假设下,聚类稳健标方差矩阵(CRVE)会得到渐进有效的t检验、Wald检验和置信区间。但是,即使样本量N非常大,当聚类G的数量不大,或者聚类分布不均(各个聚类中的个体数量差异性非常大等等),聚类稳健推断也可能不可靠,见许文立和孙磊(2023,数量经济技术经济研究)。

聚类稳健推断的文献是最近几年计量理论进展的一大领域(注:我今年会给一篇相关的理论和应用文献回顾与实践指南的工作论文《我们要多相信线性回归的标准误?推断框架的最新理论进展与实践指南》)。Cameron and Miller (2015)、Conley, Gonçalves, and Hansen (2018)、MacKinnon, Nielsen, and Webb (2023a)均给出了聚类稳健推断的最新进展综述。

目前,存在两种情形下聚类稳健t检验和wald检验会过度拒绝处理效应(标准误偏大):① 一个或少量聚类组群规模比其它聚类组群大很多;② 所有的处理个体仅仅属于少量的聚类组群。Djogbenou, MacKinnon, and Nielsen (2019)讨论了第一种情形。MacKinnon and
Webb (2017a,b, 2018)讨论了第二种情形。

在两种情形下,有一些(一个)聚类组群对OLS估计有极大的影响。MacKinnon, Nielsen,Webb(2023c)将这种具有极大影响的聚类组群成为”具有较高影响力的聚类组群“。他们开发了一个stata命令来检验这类聚类组群。这种检验对于诊断聚类稳健标准误是否可靠非常有帮助。

这个新的stata命令是summclust。这个命令也可以计算两类stata 18默认的jackknife方程矩阵估计量CV3和CV3J。

命令格式:

summclust depvar, yvar(varname) xvar(varlist) cluster(varname) [ options]

***************
* depvar是感兴趣的自变量
* xvar其它感兴趣的二值型/连续型自变量
* yvar 是感兴趣的因变量
* cluster聚类变量

为了说明summclust命令的用法,使用stata内置的数据集nlswork.dta,其中包括14-26岁的女性样本,为了简化分析,将样本限制在20-40岁之间。

我们用这个样本来看看女性结婚是否对工资有溢价效应。ln_wage是结果变量,工资对数;如果女性结婚,变量msp=1,否则为0,在行业层面industry聚类:

*加载数据,ols回归
webuse nlswork, clear
keep if inrange(age,20,40)
reg ln_wage i.grade i.age i.birth_yr union race msp, cluster(ind)
OLS回归结果---标准误CV1

上述stata的ols回归结果呈现的事CV1的结果。我们也可以呈现CV3和CV3J的标准误:

*CV3
reg ln_wage i.grade i.age i.birth_yr union race msp, cluster(ind) vce(jackknife, mse)
*CV3J
reg ln_wage i.grade i.age i.birth_yr union race msp, cluster(ind) vce(jackknife)
CV3

我们也可以使用金兰等开发的summclust命令,得到上述结果:

summclust msp, yvar(ln_wage) xvar(union race) fevar(grade age birth_yr) cluster(ind)
image.png

这个命令的结果会有两张表组成,上面一张表是核心解释变量msp的系数和CV1、CV3的标准误、t值、置信区间等等。例如,上表中CV1和CV3的标准误有显著的差异,CV3标准误更大。

第二表则呈现了聚类标准误变动的原因。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容