稳健性检验套路|内生性检验套路
目的:其他条件下结论是否成立,即符号与显著性是否改变
方案:
1. 数据角度:样本分割;不同的标准对数据重分类、聚合;蒙特卡洛/boostrap模拟取样;
元分析,整合多源数据;先匹配处理再回归;
2. 变量角度:替换变量,如:公司size可以用total assets 或 total sales衡量;
冲击变量,不断放入控制变量其系数显著且稳定在某值;
3. 计量方法: 可以用OLS, FIX EFFECT, GMM等多种方式回归,看结果是否依然robust;
稳健性:多种稳健性检验一致说明结论可靠性,进一步探究结论局限性;
解决内生性(4种来源:样本自选择、互为因果、遗漏变量、测量误差)
1.样本自选择包括人为截断&天然截断
人为截断:小于5万元按5万计算 使用Tobit模型;
天然截断:psm 和 heckman
举例 选择题A、B、C会有不同收益,要解决选A收益的选择性偏误;
psm 要知道不选A(选BC的整体)的信息;
heckman不用知道选择B、C的信息,所以只需估算选A的概率;
psm 只能解决只有两种选择(A与非A),
且知道非A的数据信息(通常,遗漏样本与已有样本变量维度/种类一致);
heckman 可以解决1.有B、C数据。可以解决不选B、C下选A收益的选择性偏误;
可以解决2.没有B、C数据。依然不影响我估算选A概率(类似IV);
其中,2种heckman命令差别不大
(1)加 twostep 报告 mills(IMR)
优点:更流行 + 可以加 vce(robust) 进行聚合
缺点:会把第一步误差带入第二阶段
Note:IMR不是概率值(一个构造值而已),带入第二阶段,可以控制概率
(2)heckman 不加twostep 默认用最大似然,报告rhos
2.互为因果:两阶段最小二乘-IV;滞后性动态面板;联立方程;似不相关回归SUR
多方程相关主要分:联立方程与似不相关SUR
联立方程:y1的解释变量中包括y2;
联立方程使用单方程估计(IV):排除了其他方程的错误设定对于某单独方程的一致性的影响,
也可以使用reghdfe等命令处理固定效应、方便聚类标准误,
跨方程的假设检验,还是需要联立起来进行估计的。
面板数据xtdata可能误估标准误易显著。
Note:存在内生性可用reg3,后面加ireg3选项的好处是迭代的计算协方差矩阵,可以达到理论最有效估计,
代价见Wooldridge的《横截面与面板数据的经济计量分析》。
SUR:y1的解释变量不包括y2,但y1,y2的扰动项相关;
SUR的内生性来自遗漏变量和测量误差,不需要使用3SLS
3.遗漏变量:增加控制变量,行业×省级×时间固定效应;FE;Match;
因果识别(截面数据不能识别因果,同时发生的事件没法说明谁造成了谁,因果本身就包含了先后,截面数据只能在理论上论述不存在内生性。。。)
DID;RDD;合成控制;
扩展性检验:分组,引申结论;
附录:有关stata命令
**(1)PSM克服自选择
psmatch2 belief happiness x1 x2//进入处理组和控制组的概率按协变量匹配
pstest, both
psgraph
//核密度估计图
//- 比较密度函数图
//-匹配前的密度函数图
*-E-version(large)
twoway (kdensity _ps if _treat==1,lp(solid) lw(*2.5)) ///
(kdensity _ps if _treat==0,lp(dash) lw(*2.5)), ///
ytitle("Density", size(*1.1)) ///
ylabel(,angle(0) labsize(*1.1)) ///
xtitle("Propensity Score", size(*1.1)) ///
xscale(titlegap(2)) ///
xlabel(0(0.2)0.8, format(%2.1f) labsize(*1.1)) ///
legend(label(1 "Treatment Group") label(2 "Control Group") row(2) ///
position(10) ring(0) size(*1.1)) ///
scheme(s1mono)
graph export "Figs\kn01_large.wmf", ///
replace fontface("Times New Roman")
//-匹配后的密度函数图
*-E-version(large)
twoway (kdensity _ps if _treat==1,lp(solid) lw(*2.5)) ///
(kdensity _ps if _wei!=1 & _wei!=.,lp(dash) lw(*2.5)), ///
ytitle("Density", size(*1.1)) ///
ylabel(,angle(0) labsize(*1.1)) ///
xtitle("Propensity Score", size(*1.1)) ///
xscale(titlegap(2)) ///
xlabel(0(0.2)0.8, format(%2.1f) labsize(*1.1)) ///
legend(label(1 "Treatment Group") label(2 "Control Group") row(2) ///
position(10) ring(0) size(*1.1)) ///
scheme(s1mono)
graph export "Figs\kn02_large.wmf", ///
replace fontface("Times New Roman")
***(2)Heckman两阶段克服自选择偏误//以oprobit为例
heckman wage edu gender,select(work=family health edu) twostep //检验是否有自选择
//选择变量内至少一一个变量与前不一致,以能生成p_work(是否工作的概率)