高级计量经济学 17:面板二值选择模型
此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。
我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分(包括证明和正文)做了修改。
仅供学习参考,请勿转载,侵删!
目录
-
17 非线性面板
- 17.1 面板二值选择模型
- 17.2 面板二值选择模型的 RE 估计
- 17.3 面板二值选择模型的 FE 估计
- 17.4 二值选择 FE 模型的估计方法:充分统计量
17.1 面板二值选择模型
对于面板数据,如果被解释变量为虚拟变量,则称为面板二值选择模型
(binary choice model for panel data)。对于二值选择行为,通常可以通过一个潜变量
(latent variable)来概括该行为的净收益(收益减去成本)。如果净收益大于0,则选择做;否则选择不做。假设净收益为:
其中,净收益 为不可观测的潜变量, 为个体效应(individual effects),而解释变量 不含常数项。个体的选择规则为:
给定 , , ,则有:
其中, 为误差项 的累积分布函数(cdf),并假设 的密度函数关于原点对称。如果 则为 Probit 模型:
如果 服从逻辑分布,则为 Logit 模型:
面板二值选择模型主要估计方法包括:
- 混合回归
- 随机效应估计
- 固定效应估计
在方程 中,如果 ,即没有个体效应,则为混合回归(pooled probit or pooled logit),可将此面板数据作为横截面数据处理(参考《高级计量16》),此时,只需要使用截面数据的相关 Stata 命令即可进行混合回归。然而,由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误(cluster-robust standard error)。
17.2 面板二值选择模型的 RE 估计
更一般地,我们允许个体效应存在,即不同的个体拥有不同的 。如果 与所有解释变量 均不相关,则称为随机效应模型
(Random Effect Model, RE, 见《高级计量16》);否则为固定效应模型
(Fixed Effect Model, FE)。
首先考虑 RE 模型。对于线性面板的 RE 模型,一般使用广义最小二乘法(GLS)进行估计。但非线性面板不便使用GLS,故转而使用最大似然估计(MLE)。假设 ,记密度函数为 。以 Logit 模型为例,给定 ,则个体 的条件分布为(参考《高级计量14》):
然而,上式的 不可观测,为此,记 的联合密度为 ,并进行如下分解:
在 的联合密度重,将 积分去掉,即可得到 的边缘密度:
上面的积分没有解析解,可以通过数值求解的方法求解,这里就不再叙述了。
假设不同个体的观测值相互独立,则可以写出整个样本的似然函数。最大化此似然函数即得到 的RE Logit 估计量
。如果将上述方程的逻辑分布 改为正态分 ,那么就是 RE Probit 估计量
。由于不同个体的观测值相互独立,故不同个体的扰动项也不相关,但由于 的存在,同一个体不同时期的扰动项之间仍存在相关:
求 。
即为所求。
如果 ,那么自相关系数为:
如果 越大,就表示复合扰动项 中个体效应 的部分比较大,不能忽视个体效应;极端地,如果 ,就表示复合扰动项中 ,个体效应接近没有,故应该使用混合回归模型。
17.3 面板二值选择模型的 FE 估计
在面板二值选择模型中,如果个体效应 与解释变量 相关,那么就是 FE 模型,
其中, 可以是 或者 。此时,如果使用 RE 模型或混合回归则得不到一致估计。
对于线性面板数据模型,参考《高级计量16》,一般采用
组内估计量
或者一阶差分
来消去固定效应 ,然后就可以正确估计 。但对于非线性面板数据而言,这些变换一般不起作用,因为无法建立可观测的 与不可观测的 (即潜变量 的组内离差)之间的对应关系。就算使用虚拟变量法(LSDV法),对于二值选择的固定效应模型,也仍然得不到一致估计(除非 * ),这是因为,当 时,待估计的个体效应 的个数也随之增加。这些 被称为
伴生参数
(incidental parameters)。另一方面,每一个 只能由个体 的 个观测值来估计,而 并不增加。对于现实的数据, 通常很小,从而 且 有限时, 不会收敛。更重要的问题是,对 的不一致估计还会使得 的估计也不一致,这被称为伴生参数问题
。
在线性面板模型中,可以通过组内变换或差分变换解决伴生参数问题,但对于固定效应的面板 Probit 模型,目前尚无法解决此类伴生参数问题。
17.4 二值选择 FE 模型的估计方法:充分统计量
对于固定效应的面板 Logit 模型,可以通过寻找 的充分统计量
(sufficient statistic),然后在给定此充分统计量的条件下进行条件最大似然估计
(conditional MLE)。
充分统计量是统计学的一个概念。考虑总体参数 与统计量 。如果统计量 包含了样本中所有可以用来估计 的信息,则称 是参数 的充分统计量。
换言之,给定 以后,任何根据样本计算的其他统计量都不可能提供关于 的额外信息。
对于 Logit 模型,Chamberlain(1980)提出使用
作为 的充分统计量,并计算在给定 情况下的条件似然函数(根据充分统计量的性质,此似然函数不再依赖于 ),然后进行条件似然最大估计。然而,对于 Probit 模型,却找不到 的充分统计量。
以最简单的两期模型为例进行说明,即 。此时,对于个体 ,只有以下三种可能: 。下面分别考虑着三种情形:
(1)
,此时必然 ,从而 ,其对数似然函数为 ,故对整个样本的似然函数没有贡献。
直观来看,由于此条件似然函数的取值为常数,故此观测值不包含任何可以用于估计 的信息,因此,在进行条件似然估计时,是否包含这些观测值并不影响估计结果。
事实上,等于损失了这些样本的观测值。
(2)
,此时必然 ,从而 ,同理,这些观测值并不包含任何有助于估计 的信息,应该忽略
(3)
此时,或者 或者 ,分别计算其条件概率为:
假设给定 和 的条件下, 和 相互独立,则:
将表达式 和 代入 中,可得:
注意到, 在分子分母都有 项,于是被消除了。同理,将 和 代入 可得:
如果定义虚拟变量:如果 则 否则 ,那么就可以把 和 写在一起,并将个体 的条件对数似然函数写为:
其中 为示性函数,表示仅考虑 的观测值。上式对 加总,即可得到整个样本条件对数似然函数。
从 我们发现:
给定 的条件似然函数不再依赖于
此条件似然函数仍为 Logit 模型,只是解释变量变为
不随时间变化的变量将无法识别其系数,因为其
固定效应似然函数并不包含积分,不需要进行积分计算
更一般地,对于 ,可以计算给定 或 的条件似然函数。固定效应模型的缺点是,将损失所有 或 的观测值,导致样本容量减少;并且由于 消去了,也无法估计个体效应 ,也无法预测 发生的概率或解释变量对 的边际效应。解决的方法是假设