静态面板数据分析

静态面板数据的主要问题

横截面异方差
序列自相关
横截面同期相关

基础工作

屡次失败的经验表明，洗数据和看数据是非常基础且不可或缺的工作。基础不牢地动山摇，后面的分析全部得再来一遍，期间又会出现各种error。因此，面板数据分析的前几步毫无疑问就是

1. 数据清理

由于面板也是时间序列，为避免伪回归问题，很多人纠结是否应当先进行平稳性检验及差分。并非所有的面板数据都要进行平稳性处理，如短面板数据或N与T接近的情形，由于T信息含量不足，不考虑扰动项序列自相关。只有设定为时间序列模型的情况下才需要进行平稳性检验。

2. 描述性分析

xtdes 这个命令的重点在于看数据的轮廓：

大N小T or 大T小N or 大N大T，即估计量的渐近性质
a. N→∞比T→∞的渐近特性更合适：可以假定横截面具有大致的无关性（不存在组间同期相关）；由于T小，不考虑序列自相关或通过聚类稳健标准误解决；适用短面板模型（FE,RE,GMM)
b. T与N阶数相同或相近：可以假定时间序列无关性（不存在组内自相关）；适用PCSE(hetonly)或面板误差修正模型
c. T比N大：适用长面板模型或多元时间序列分析
balanced or unbalanced，进一步
xtbalance, range(#year_begin #year_end) miss(_all)

xtdes 数据概览

xtsum 观察各变量是否正常：

mean 最好统一量纲，如人均实际GDP取对数
min和max 是否在合理区间内
N, n和T 各变量缺失值情况，区间长度可能不一致（与xtbalance配合使用）

xttab 类别变量

correlate 相关性分析的必要性：

被解释变量和核心解释变量之间的关系，初步判断模型设定是否合理
e.g. 负相关与设定为U型关系的模型
核心解释变量与工具变量之间的关系，事关内生性

P.S. 改变数据结构的两个常用命令 reshape 和 gather

3. 画图

xtline 变量间关系可视化：与模型设定是否一致？与模型结果是否一致？

面板模型及其Stata命令概览

面板模型根据数据的结构可以分为长短面板，也可以根据模型的设定分为静态面板和动态面板。本文关注的是线性不可观测效应的面板数据模型，常用命令如下：

xtreg Fixed-, between-, and random-effects, and population-averaged linear models
xtregar Fixed- and random-effects linear models with an AR(1) disturbance
xtgls Fit panel-data models by using GLS

xtpcse Linear regression with panel-corrected standard errors
xthtaylor Hausman–Taylor estimator for error-components models
xtfrontier Stochastic frontier models for panel data
xtrc Random-coefficients model
xtivreg Instrumental variables and two-stage least squares for panel-data models
Source: Stata Longitudinal-Data/Panel-Data Reference Manual - Linear regression estimators

短面板模型

1. 混合回归

由于混合回归非常简单，人一兴奋就直接run reg 和 xtreg, fe 然后Hausman检验。这个做法相当不严谨，产生了误导性结果。记住，所有模型的第一步是进行假设检验。

1.1 假设检验

混合回归 (Pooled regression) 也被称为“总体平均估计量 (Population-averaged model, or PA) ”，基本假设是不存在个体效应（包括固定效应和随机效应），因此必须对这个假设进行检验。

(1) 固定效应检验

F检验（不推荐）
xtreg y x1 x2 x3, fe
注意是最下面一行的“F test that all u_i = 0”，不是表头的F检验。
H0：接受混合回归；H1：FE优于混合回归。
缺点：未使用稳健标准误估计，因此F检验有效性存疑。使用稳健标准误则愚蠢的stata不会报告F检验结果。
LSDV法
reg y x1 x2 x3 i.id, vce cluster(id)
test id*
test id*=0
若虚拟变量显著不为0，则存在个体效应，不应使用混合回归。

(2) 随机效应检验

FGLS
xtreg y x1 x2 x3, re r theta
xttest0
LM检验H0：不存在个体随机效应。
MLE
xtreg y x1 x2 x3, mle [nolog]
估计结果的最后一行“Likelihood ratio test of sigma_u=0"。

1.2 `xtreg` 和 `reg` 的区别

xtreg 默认设定是随机效应模型，混合OLS应当使用 reg 或者 xtreg, pa 。

1.3 混合OLS基本格式

reg y x1 x2 x3, vce cluster(id)

划重点：

由于不存在个体效应，回归中不应包含截面id的虚拟变量。
使用聚类稳健标准误
同一个体不同时期的扰动项往往存在自相关，聚类稳健标准误可以克服组内自相关。Stata默认使用的普通稳健标准误（假设扰动项为i.i.d) 大约是聚类稳健标准误的一半，因此不准确。从这个角度看，此处聚类稳健标准误的使用与cluster个数无关。(挖个坑，待填）
在声明面板数据之后，选择项 ,robust 和 ,vce cluster(id) 效果完全相同。

2. 个体效应模型

模型选择问题：Hausman检验
考虑双向固定效应：控制时间变量，并检验其显著性
若数据质量不好，可考虑使用组间估计量（Regression on group means)，或供模型对比参考使用，命令为 xtreg y x1 x2 x3, be
不要忘记使用聚类稳健标准误
由于LSDV法跟FE模型得到的估计量是一致的，因此在使用RE、BE和PA模型的时候注意不可加入截面id的虚拟变量。
多维固定效应 reghdfe
这是一个可以处理多维固定效应（向下兼容）、可以聚类到3个层面、还可用工具变量处理内生性的命令，推荐使用。安装方法如下：

ssc install reghdfe
一般情况下会报错：“command ftools is unrecognized”
检查ftools是否已安装：reghdfe, version
安装ftools：ssc install ftools
可能成功安装，可能继续报错：“connection timed out”
这时候就需要手动安装了：ftools手动安装包
下载zip解压到相应的ado文件夹中即可

长面板模型

1. 假设检验

组间异方差：Wald test
xtreg y x1 x2 x3 i.id t, r fe 或 xtgls y x1 x2 x3 i.id t
xttest3
组内自相关：一阶差分回归（FD)
xtsetrial y x1 x2 x3 i.id t [,output]
组间同期相关：
(1) LM检验--仅适用长面板
xtreg y x1 x2 x3 i.id t, r fe 或 xtgls y x1 x2 x3 i.id t 或 ivreg2
xttest2
(2) 截面相关检验（cross-sectional dependence)--普遍适用
xtreg
xtcsd, pes
xtcsd, fri
xtcsd, fre abs show

2. 相应模型

组间异方差：PCSE (hetonly)
xtpcse y x1 x2 x3 i.id t, hetonly
组内自相关：FGLS
(1) 截面自回归系数相同 xtpcse y x1 x2 x3 i.id t, corr(ar1)
(2) 截面自回归系数不同 xtpcse y x1 x2 x3 i.id t, corr(psar1)
组间异方差+组间同期相关：PCSE(default)
xtpcse y x1 x2 x3 i.id t
组间异方差+组间同期相关+组内自相关：全面FGLS
xtgls y x1 x2 x3 i.id t, panels(cor) corr(ar1) igls
当异方差、序列相关以及截面相关性质未知时，最合适的处理方法是xtscc 命令，可以得到FE模型的稳健型标准误，但在N远大于T的情况下也应慎用。

注意：分析长面板数据的 xtgls 和 xtpcse 命令都没有考虑个体效果 (fixed effects) ，他们对截面异质性的处理都是通过 OLS 估计得到的残差进行了，也就是采用OLS估计的残差估得稳健型方差-协方差矩阵。因此，上述回归中均加入了i.id。这种情形下考虑固定效应有两种方法：

(1) 加入 N-1 个虚拟变量(LSDV法）

tab id, gen(dumid)
drop dumid1
xtgls y x dumid*, p(h) corr(ar1)

长面板的估计策略

(2) 先采用 xtdata 命令去除个体效果，再采用 xtgls 命令进行估计

preserve
xtdata y x , fe clear
xtgls y x, p(h) corr(ar1)
restore

推荐采用后者，因为当 N 较大时，前者的输出结果管理起来比较繁琐。

Source: 连玉君的回答，固定效应的FGLS估计怎么做

面板工具变量法

这一块以后跟GMM一起写。（又挖个坑）

IV和GMM相关估计步骤，内生性、异方差性等检验方法

一文读懂GMM的stata操作步骤

古往今来，哪一个工具变量没有争议？寻找工具变量

变量内生性和工具变量知识汇总

Refer：陈强《高级计量经济学及stata应用（第二版）》

最后编辑于：2018.11.05 16:55:54

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 214,837评论 6赞 496
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,551评论 3赞 389
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 160,417评论 0赞 350
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,448评论 1赞 288
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,524评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,554评论 1赞 293
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,569评论 3赞 414
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,316评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,766评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,077评论 2赞 330
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,240评论 1赞 343
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,912评论 5赞 338
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,560评论 3赞 322
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,176评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,425评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,114评论 2赞 366
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,114评论 2赞 352