做了多年的实证研究,突然感觉,这是一个既可以很难,又可以很简单的事。
简单的是,很多数据是现成的,测度方法是可以模仿文献的,建模方法是有成型代码的,解读是可以翻书模仿的,结论可以是跟其他文章类似的。正因如此,一个本科生10天就可以出一篇论文。
可明明,写出一篇好的实证文章又很难,难,或者让文章出色的到底在哪里呢?
在我看来,有五难需要破除。
一难难在选题,你是否能在宏观多变的时代背景下抽象出具有学科研究价值的问题?你是否能在遍览文献之后找到有用又可为的突破点?你是否能够结合数据条件,结合理论基础能够凝练出一个能够符合自己水平,有力量能够推进的选题,如果不能,能否找到合理的阶梯攻克,有效分解问题,这是第一难。这一难,入门水平是跟别人要,跟文献抄,高手水平是自己悟,跳入文献,跳入现实的大海反复思量之后,最终才凝练出核心。
二难难在故事。好的文章一定不是只回答一个问题,而是一连串有联系、有推进、有故事的问题组合,如何设计问题顺序,如何设计故事逻辑,如何层层深入像把人带入一个新世界一样,慢慢推进问题与结论,这考验我们的全局观和故事力,此为第二难。这一难,入门水平是遵循模版逻辑,先总体,后分群体,再分时期,高手水平则是根据问题内在的逻辑,设计推理故事,宛若在讲一个层层相扣的故事。
三难难在理论。问题的回答需要有依有据,你如何运用理论的线严密缝上问题的缺口,你如何创造性的运用理论拼接起通往问题答案的桥梁,高度考验我们的逻辑推理与理论理解深度,此为第三难。这一难,入门水平是根据文献的只言片语进行拼凑,高手水平则是在悟透理论精要之后的连接与顿悟,甚至是总结发明推理出自己的全新理论来解释问题,这往往是巨大创新蕴含的地方。
四难难在数据。实证研究,数据就是最关键的论据,如何根据问题广泛搜集合适的数据,如何合理连接概念的抽象与数据的真实,如何从数据所反映的图景背后看到问题的答案,对问题的准确回答都有影响。同时,在大数据环境下,如何有效采集数据,清理数据,整合数据,可以是一项也繁也难的技术活,这一难,入门水平是找最好找的宏观数据,用文献中普遍使用的测度手段就可进行,而高手则是深谙数据背后的真实内涵,同时广泛搜寻适合问题的各类数据(而不仅仅是传统数据源),并对数据进行有序的处理,精心理解概念内涵,选择测度手段,这往往是让文章接地气的关键
五难难在模型。模型,是用数据回答问题的工具。如何合理选择模型,如何评价问题条件与模型假设之间的匹配度,如何运用代码实现模型,正确解读好结果是运用模型的难处。这一难,入门水平是直接看一些好的期刊使用到的模型,然后查到原理,查到代码即可马上上手,而高手则会深谙每种模型的使用条件,估计策略,运用精髓,以及遇到问题如何处理的经验做法,甚至可以根据数据需求定制化开发修改模型,而这往往是让文章高度专业化的体现。