有了计量模型与数据之后,可根据数据类型与特点,选择合适的计量方法。
比如,被解释变量为虚拟变量,可使用 Probit 或 Logit。如果是面板数据,应考虑固定效应、随机效应、时间效应等。
如果是时间序列,须先判断是否含单位根,再决定使用相应的计量方法。
对于一般数据,通常先作 OLS,看结果,作为参照系。作完OLS 后,可画残差图,大致看扰动项是否符合经典假定,然后进行严格检验。如有所违背(比如,异方差、自相关),则做相应处理。对于时间序列,可检验是否存在结构变动(邹检验)。应对数据质量进行检验,判断是否存在多重共线性、极端值、弱工具变量等,并做相应调整。由于受数据可得性(availability)的限制,遗漏变量几乎不可避免,有必要在论文中对此进行讨论。面板数据可在一定程度上克服遗漏变量问题,故比横截面数据或时间序列更有说服力。如可获得面板数据,应尽力争取。
比如,对于中国的宏观变量,如使用全国的时间序列,一般样本容量较小,可考虑省际面板(provincial panel)数据。另一常见问题是内生解释变量。一般需找到有效工具变量才能得到一致估计。大多数实证论文都希望说明 x 对 y 的因果作用。从回归分析的相关关系升华到因果关系,是很大的飞跃,需要使用适当的计量方法来识别这种因果关系。