03 内生性和稳健性检验_did稳健性检验_黑百椰的博客

1 平行趋势检验

在介绍完DID的基本思想和模型设定后，我们再来说说DID的稳健性检验，也就是要想办法证实所有效应确实是由政策实施所导致的。
所谓共同趋势或者平行趋势，是指处理组和控制组在政策实施之前必须具有相同的发展趋势。
如果不满足这一条件，那么两次差分得出的政策效应β就不完全是真实的政策效应，其中有一部分是由处理组和控制组本身的差异所带来的。如果平行趋势假设成立，那么在政策时点之前，处理组和控制组应该不存在显著差异。
1.1 时间趋势图

绘制处理组和控制组的y的均值的时间趋势政策前几年，置信区间包括0，即不显著，接受系数为0的原假设；政策后，置信区间不包括0，显著，拒绝系数为0的原假设，说明政策实施后处理组和控制组发生了不同的变化。实际上，即使政策实施后的好几年才显著不为0，也可以表示通过了平行趋势检验，这是由于考虑到了政策实施有滞后效应。
1.2 事件研究法

生成年份虚拟变量yearj与处理组虚拟变量treati的交互项，加入模型中进行回归(M、N分别表示政策前和政策后的期数)，那么交互项treatixYEARj的系数δj衡量的就是第j期处理组和控制组之间的差异。
step1 生成年份虚拟变量与实验组虚拟变量的交互项，此处选在政策前后各3年进行对比。

gen period = year - 1994   // 计算距离政策实施前后的年份
forvalues i = 3(-1)1{     // 政策发生之前，向前做三期
  gen pre_`i' = (period == -`i' & treated == 1) 
gen current = (period == 0 & treated == 1)
forvalues j = 1(1)3{     // 政策发生之后，向后做三期
  gen  time_`j' = (period == `j' & treated == 1)
 drop pre_1               // 为了避免多重共线性，drop掉一期
step2 随后将这些交互项作为解释变量进行回归，并将结果储存在reg中以备后续检验。
 
xtreg y time treated pre_* current time_* i.year, fe  
est sto reg
step3 采用coefplot命令进行绘图
 
coefplot reg,  ///
keep(pre_* current time_*)  ///  //横坐标
vertical ///
recast(connect) ///
yline(0) xline(3, lp(dash)) ///
addplot(line @b @at) ///
ciopts(lpattern(dash) ///
recast(rcap) ///
msize(medium)) msymbol(circle_hollow) scheme(simono)
 结果发现系数在政策前的确在0附近波动，而政策后一年系数显著为负，但很快又回到0附近。这说明实验组和控制组的确是可以进行比较的，而政策效果可能出现在颁布后一年，随后又很快消失。 
2 安慰剂检验
 
即使满足平行趋势检验，也不代表就是我们关心的政策导致了y的变动。 
2.1 核心思想
 
虚构处理组或者虚构政策时间进行估计，如果不同虚构方式下的估计量的回归结果依然显著，那么就说明说明原来的估计结果很有可能出现了偏误，我们的被解释变量y的变动很有可能是受到了其他政策变革或者随机性因素的影响。 
在现有的政策性评估文章中，有很多种进行安慰剂检验的方法。具体如下所述。 
 第一种,可以采用政策发生之前的数据。将政策实施前的除第一年之外的所有年份“人为地”设定成为处理组的政策实施年份，然后根据DID模型逐年回归。当所有回归中的交互项系数都不显著时,说明通过了安慰剂检验,表明之前识别的政策平均效应是可靠的，否则就是不可靠的。如果政策实施前有n年数据，那么就要做n-1次上述回归。
 
 第二种，可以“人为地”随机选择政策实施对象(处理组)，然后使用全样本做DID回归。如果交互项系数不显著，则判断政策对随机选择的处理组都不存在政策效应，可以进一步证明之前识别的政策平均效应结果是可靠稳健的
 
 第三种，改变被解释变量,通常选择理论上不受政策影响的其他变量,保持真实的对照组和处理组、真实的政策实施时间，重新进行DID 回归，理想的结果是，该政策的实施对其他被解释变量都不存在政策效应。
  
2.2 改变政策发生时间
 
在《经济研究》和《管理世界》发表的文章中，有近 1/3 的安慰剂检验使用的是前置政策发生时间。这在实际操作中也并不困难，设定一个虚拟的政策发生年份代替真实的政策发生年份，之后纳入回归即可。 
王永钦和吴娴 (2019) 利用 2018 年 6 月 1 日中国人民银行扩大中期借贷便利 (MLF) 担保品范围政策这一准自然实验和债券市场微观数据，采用三重差分法识别了基于抵押品的货币政策的作用机制和政策效果。但是，文章结论的潜在威胁是，债券利差的下降可能是由市场的周期性变化而非政策导致的。为了证明前文回归结果的稳健性，作者设定了 2015 年 6 月 1 日为虚拟的货币政策实施时间，使用了 2015 年 1 月 1 日—2015 年 9 月 30 日发行的 AA 级以上公司信用类债券和金融债数据进行了安慰剂检验。 
林毅夫等 (2020) 使用双重差分法、三重差分法和合成控制法来识别消费券的发放效果，并评估政府在助力经济复苏中的作用。但潜在的威胁是，发券城市的市民本身就有更强的消费倾向。为此，作者进行了安慰剂检验，分别假设消费券发放的时间提前 30 天或者 15 天，然后考察这些虚拟的消费券发放是否会影响支付笔数。 
关于采用改变政策发生时间进行安慰剂检验的方法，还可参考以下文献： 
 [1] 曹春方, 张超. 产权权利束分割与国企创新——基于中央企业分红权激励改革的证据[J]. 管理世界, 2020, 36(09):155-168. -Link-
 
 [2] 李广众, 贾凡胜. 财政层级改革与税收征管激励重构——以财政 “省直管县” 改革为自然实验的研究[J]. 管理世界, 2020, 36(08):32-50. -Link-
 
 [3] 林毅夫, 沈艳, 孙昂. 中国政府消费券政策的经济效应[J]. 经济研究, 2020, 55(07):4-20. -Link-
 
 [4] 许红梅, 李春涛. 社保费征管与企业避税——来自《社会保险法》实施的准自然实验证据[J]. 经济研究, 2020, 55(06):122-137. -Link-
 
 [5] 刘诗源, 林志帆, 冷志鹏. 税收激励提高企业创新水平了吗?——基于企业生命周期理论的检验[J]. 经济研究, 2020, 55(06):105-121. -Link-
 
 [6] 徐超, 庞雨蒙, 刘迪. 地方财政压力与政府支出效率——基于所得税分享改革的准自然实验分析[J]. 经济研究, 2020, 55(06):138-154.-Link-
 
 [7] 许明, 李逸飞. 最低工资政策、成本不完全传递与多产品加成率调整[J]. 经济研究, 2020, 55(04):167-183.-Link-
 
 [8] 刘啟仁, 赵灿. 税收政策激励与企业人力资本升级[J]. 经济研究, 2020, 55(04):70-85.-Link-
 
 [9] 张克中, 欧阳洁, 李文健. 缘何 “减税难降负”：信息技术、征税能力与企业逃税[J]. 经济研究, 2020, 55(03):116-132.-Link-
 
 [10] 尹志超, 沛瑶, 张琳琬. “为有源头活水来”：精准扶贫对农户信贷的影响[J]. 管理世界, 2020, 36(02):59-71+194+218.-Link-
 
 [11] 施新政, 高文静, 陆瑶, 李蒙蒙. 资本市场配置效率与劳动收入份额——来自股权分置改革的证据[J]. 经济研究, 2019, 54(12):21-37.-Link-
 
 [12] 王永钦, 吴娴. 中国创新型货币政策如何发挥作用：抵押品渠道[J]. 经济研究, 2019, 54(12):86-101.-Link-
 
 [13] 黄俊威, 龚光明. 融资融券制度与公司资本结构动态调整——基于 “准自然实验” 的经验证据[J]. 管理世界, 2019, 35(10):64-81.-Link-
 
 [14] 吕越, 陆毅, 吴嵩博, 王勇. “一带一路” 倡议的对外投资促进效应——基于 2005—2016 年中国企业绿地投资的双重差分检验[J]. 经济研究, 2019, 54(09):187-202.-Link-
 
 [15] 唐宜红, 俞峰, 林发勤, 张梦婷. 中国高铁、贸易成本与企业出口研究[J]. 经济研究, 2019, 54(07):158-173.-Link-
 
 [16] 徐现祥, 李书娟. 官员偏爱籍贯地的机制研究——基于资源转移的视角[J]. 经济研究, 2019, 54(07):111-126.-Link-
 
 [17]朱晓文, 吕长江. 家族企业代际传承:海外培养还是国内培养?[J]. 经济研究, 2019, 54(01):68-84.-Link-
 
 [18] 刘啟仁, 赵灿, 黄建忠. 税收优惠、供给侧改革与企业投资[J]. 管理世界, 2019, 35(01):78-96+114.-Link-
 
 [19] 魏志华, 曾爱民, 吴育辉, 李常青. IPO首日限价政策能否抑制投资者 “炒新”?[J]. 管理世界, 2019, 35(01):192-210.-Link-
  
2.3 随机生成实验组
 
刘瑞明等 (2020) 根据中国文化体制改革的 “准自然实验”，采用中国 283 个地级市 2002—2016 年间的面板数据，评估了文化体制改革对地区旅游业发展的影响。对于文章的结论而言，一个可能的质疑是，人均国内旅游人次、人均国内旅游收入、人均国内外旅游总人次和人均国内外旅游总收入四个指标的统计显著可能来自于某些随机因素。为此，作者借鉴 Li 等 (2016) 和 Cantoni 等 (2017) 的方法进行安慰剂检验，以判断文化体制改革的旅游促进效应是否是由其他随机性因素引起的。 
具体来看，刘瑞明等 (2020) 通过随机生成实验组的方式进行安慰剂检验，以判断文化体制改革的旅游促进效应是否是由其他随机性因素引起的。利用这一方法进行安慰剂检验主要目的是，排除由其他随机因素造成的经济后果，以得到更加可信的因果识别效应。通过随机抽取实验组，重复多次，提取安慰剂结果系数或值，然后将其绘制在图中，并观察真实的政策效应与安慰剂结果。当真实的政策效应与安慰剂检验结果显著不同时，可排除其他随机因素对结果的干扰。具体可见下图： 
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gNDFlHH0-1664346822262)(http://imgi101i120.360doc.com/DownloadImg/2021/06/2911/225239717_1_20210629110156802?Expires=1664333136&Signature=Bpp%2FgjiqbeWWTNNC0oZGLyegOXI%3D&domain=109 “刘瑞明等”)] 
张克中等 (2020) 为研究信息技术、征税能力与企业逃税间关系，借助 “金税三期” 工程这一准自然实验，利用 2008—2016 年上市公司的微观数据和双重差分的估计方法进行相关分析。并借鉴 Chetty 等 (2009) 的做法，随机安排 “金税三期” 工程实施的年份和地区，重复此过程 10000 次，来进行安慰剂检验。 
例3（含stata命令）
 
论文1、“一带一路”倡议促进了中国高质量出口吗——来自微观企业的证据 
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iWcehsUA-1664346822265)(D:\Temp\Desktop\学习\计量经济学\Markdown笔记\图片来源\1.png)] 
*******************
**图2：安慰剂检验**
*******************
cd C:\Users\user\Desktop\数据\placebo
set more off
forvalues i=1(1)500 {
use dodata,clear
save ydyl_data,replace
use ydyl_data,clear
keep citycode _日期
bysort citycode _日期: gen temp_code=_n
keep if temp_code==1
drop temp_code
drop if _日期==2010
save dummy_data,replace
use dummy_data,clear
** create the false dataset
bysort _日期: keep if _n==1
sample 1, count
keep _日期
save temp,replace
use dummy_data,clear
merge m:1 _日期 using temp
keep if _merge==3
drop _merge
sample 36, count
keep _日期 citycode
rename _日期 ydyl_日期
save ydyl_time,replace
* Generate the false_ydyl_after variable
use ydyl_time
merge 1:m citycode using ydyl_data
gen false_citycode=(_merge==3)
drop _merge
egen tt=mean(ydyl_日期)
replace ydyl_日期=tt
drop tt
gen false_after=(_日期-ydyl_日期>=0)
gen false_ydyl_after=false_citycode*false_after
save ydyl_data,replace
* Regression
reghdfe ln_quality false_ydyl_after Capital_City_t Yangtz_City_t ratio_fiscal_t ratio_gdp_t lnstudent_t ratio_city_t Capital_City_t2 Yangtz_City_t2 ratio_fiscal_t2 ratio_gdp_t2 lnstudent_t2 ratio_city_t2 Capital_City_t3 Yangtz_City_t3 ratio_fiscal_t3 ratio_gdp_t3 lnstudent_t3 ratio_city_t3 , absorb(i._日期 _企业编码) vce(cluster province)
parmest,format (estimate min95 max95 %8.2f p %8.3f) saving("temp.dta", replace)
use "temp.dta", clear
keep if parm=="false_ydyl_after"
append using "ydyl_simulations.dta"
save "ydyl_simulations.dta", replace
erase "temp.dta"
use "ydyl_simulations.dta", clear
drop if estimate==.
save "ydyl_simulations.dta", replace
**Graphs
*Density Plot
dpplot estimate,xline(0.129) xtitle("虚假估计系数") ytitle("估计系数密度分布")  saving("PDF_ydyl_dpplot.gph", replace)
 [1] 曹春方, 张超. 产权权利束分割与国企创新——基于中央企业分红权激励改革的证据[J]. 管理世界, 2020, 36(09):155-168.-Link-
 
 [2] 刘畅, 曹光宇, 马光荣. 地方政府融资平台挤出了中小企业贷款吗?[J]. 经济研究, 2020, 55(03):50-64.-Link-
 
 [3] 周波, 赵国昌. 中国间接税税负归宿研究:汽车市场准自然实验的证据[J]. 经济研究, 2020, 55(03):133-147.-Link-
 
 [4] 张克中, 欧阳洁, 李文健. 缘何 “减税难降负”：信息技术、征税能力与企业逃税[J]. 经济研究, 2020, 55(03):116-132.-Link-
 
 [5] 毛其淋. 贸易政策不确定性是否影响了中国企业进口?[J]. 经济研究, 2020, 55(02):148-164.-Link-
 
 [6] 刘瑞明, 毛宇, 亢延锟. 制度松绑、市场活力激发与旅游经济发展——来自中国文化体制改革的证据[J]. 经济研究, 2020, 55(01):115-131.-Link-
 
 [7] 吕越, 陆毅, 吴嵩博, 王勇. “一带一路” 倡议的对外投资促进效应——基于 2005—2016 年中国企业绿地投资的双重差分检验[J]. 经济研究, 2019, 54(09):187-202.-Link-
 
 [8] 宋弘, 孙雅洁, 陈登科. 政府空气污染治理效应评估——来自中国 “低碳城市” 建设的经验研究[J]. 管理世界, 2019, 35(06):95-108+195.-Link-
 
 [9] 周茂, 李雨浓, 姚星, 陆毅. 人力资本扩张与中国城市制造业出口升级:来自高校扩招的证据[J]. 管理世界, 2019, 35(05):64-77+198-199.-Link-
  
2.4 替换变量安慰剂检验
 
替换变量进行安慰剂检验主要分为替换被解释变量和替换解释变量。与稳健性检验有所不同的是，稳健性检验希望在替换变量后结果依然稳健，而安慰剂检验希望替换变量后结果不再显著。首先，替换被解释变量。某项政策实施后，对特定经济活动会产生影响，但并不是对所有的经济活动都会产生影响。因此，将被解释变量替换为预期不会受到政策影响的变量进行安慰剂检验，以排除其他可能的干扰因素。例如： 
陈林和万攀兵 (2019) 以双重差分法实证检验了《京都议定书》的政策效果。由于《京都议定书》未将 PM2.5 纳入减排考核目标，这诱使 CDM 项目实施方对 PM2.5 的防治有所忽略。可以预期，CDM 项目的实施并不会对以 PM2.5 为代表的常规空气污染物产生显著的减排效果。因此，以 PM2.5 为被解释变量进行安慰剂检验。 
其次，替换解释变量。这一方法似乎没那么常用，或者说与前文的随机生成实验组和替换样本安慰剂检验有些类似之处。做法主要是将解释变量替换为看起来相似，但经济意义不同的变量。例如： 
梁斌和冀慧 (2020) 在研究失业保险如何影响求职努力时，使用 “有失业保险” 的虚拟变量作为解释变量进行安慰剂检验。这主要是因为 “有失业保险” 不等于 “领取失业保险金”。 
马黎珺等 (2019) 通过机器学习对 2009-2015 年的分析师报告进行了文本分析，以检验分析师报告的文字内容是否传递增量信息。结果表明，在控制了定量信息的影响之后，分析师报告中前瞻性语句的情感与报告发布后的累积超额收益显著正相关，说明前瞻性语句向市场传递了增量信息。在文章的稳健性检验部分，采用伪前瞻性语句对主要结果进行了安慰剂检验，以排除窗口期内其他并发事件对本文结果的影响。 
关于替换变量进行安慰剂检验的方法，还可参考以下文献： 
 [1] 沈坤荣, 周力. 地方政府竞争、垂直型环境规制与污染回流效应[J]. 经济研究, 2020, 55(03):35-49.-Link-
 
 [2] 梁斌, 冀慧. 失业保险如何影响求职努力?——来自 “中国时间利用调查” 的证据[J]. 经济研究, 2020, 55(03):179-197.-Link-
 
 [3] 郑新业, 王宇澄, 张力. 政府部门间政策协调的理论和经验证据[J]. 经济研究, 2019, 54(10):24-40.-Link-
 
 [4] 马黎珺, 伊志宏, 张澈. 廉价交谈还是言之有据?——分析师报告文本的信息含量研究[J]. 管理世界, 2019, (07):182-200.-Link-
 
 [5] 陈林, 万攀兵.《京都议定书》及其清洁发展机制的减排效应——基于中国参与全球环境治理微观项目数据的分析[J]. 经济研究, 2019, 54(03):55-71.-Link-
 
 [6] 范子英, 赵仁杰. 法治强化能够促进污染治理吗?——来自环保法庭设立的证据[J]. 经济研究, 2019, 54(03):21-37.-Link-
  
2.5 与不同因果推断方法相对应
 
 工具变量：替换样本；
 
 双重差分：改变政策发生时间与随机生成实验组；
 
 断点回归：改变断点和查看控制变量是否有跳跃；
 
 合成控制：将控制组看做实验组进行分析。
 ——基于中国参与全球环境治理微观项目数据的分析[J]. 经济研究, 2019, 54(03):55-71.-Link-
 
 [6] 范子英, 赵仁杰. 法治强化能够促进污染治理吗?——来自环保法庭设立的证据[J]. 经济研究, 2019, 54(03):21-37.-Link-
  
2.5 与不同因果推断方法相对应
 
 工具变量：替换样本；
 
 双重差分：改变政策发生时间与随机生成实验组；
 
 断点回归：改变断点和查看控制变量是否有跳跃；
 
 合成控制：将控制组看做实验组进行分析。
 
                                    双重差分法，英文名Differences-in-Differences，别名“倍差法”，小名“差中差”。作为政策效应评估方法中的一大利器，双重差分法受到越来越多人的青睐，概括起来有如下几个方面的原因：(1)可以很大程度上避免内生性问题的困扰：政策相对于微观经济主体而言一般是外生的，因而不存在逆向因果问题。此外，使用固定效应估计一定程度上也缓解了遗漏变量偏误问题。(2)传统方法下评估政策效应，主要是...
                                    This chapter discusses how applied researchers in corporate finance can address endogeneity concerns. We begin by reviewing the sources of endogeneity— omitted variables, simultaneity, and measurement error— and their implications for inference. We then discuss in detail a number of econometric techniques aimed at addressing endogeneity problems including: instrumental variables, difference-in-differences estimators, regression discontinuity
design, matching methods, panel data methods, and higher order moments estimators. The unifying themes of our discussion are the emphasis on intuition and the applications to corporate finance.
                                    1. 什么是安慰剂检验
随着「因果推断方法」在实证研究中的使用比例不断提升，越来越多的文章也会进行安慰剂检验。其检验基本原理与医学中的安慰剂类似，即使用「假的政策发生时间或实验组」进行分析，以检验能否得到政策效应。如果依然得到了政策效应，则表明基准回归中的政策效应并不可靠。进一步，经济结果可能是由其他不可观测因素导致的，而非关注的政策所产生。
2. 为什么要进行安慰剂检验
在实证研究中，无论是稳健性检验，还是安慰剂检验，亦或是异质性分析，其背后真实的目的只有两方面：
	第一，使得文章故事性更强，逻
                                    简单介绍一下实证论文中双重差分法（DID）的安慰剂检验（Placebo Test）在Stata中如何操作。
（本文首发于个人微信公众号DMETP，是往期两篇推文的合辑，欢迎关注！）
下面的内容根据实际使用的数据集分为两个部分。
一是以一个截面数据集为例，介绍一下安慰剂检验的整个思路与流程。这里使用的是系统数据集auto.dta，由于是简单介绍思路，因此该部分并没有第二部分面板数据那么复杂，且模型中不包括DID的交互项，仅仅是对一个核心变量rep78进行1,000次随机抽样；
二是以一个面板数据集为例
                                    数字内容平台越来越多地使用付费墙来产生订阅收入，但是将内容放在付费墙后面会减少消费和广告收入。 这项研究分析了当消费者内生决定其消费时的最优付费专柜设计。 我们发现，在适度的广告费率下，当消费者在消费内容的成本方面显示出足够的异质性时，免费提供有限数量的内容的计量收费墙是最佳的。 当广告费率提高时，人们通常会期望平台提供更多的免费内容，从而产生更高的广告收入。 相反，我们发现有时提供较少的免费内容并降低价格可以吸引新订户，从而产生更高的收入。 此外，取决于广告费率，最佳免费内容量可以减少或增加消费者对内容的评估。 随着消费者估价的提高，他们的付费订阅意愿和对内容消费的渴望也随之增加。 在低广告率下，前一种效果占主导地位，并激励该平台提供较少的免费内容，但在高广告率下，情况则相反。 与直觉相反，我们还发现，总内容消耗会随着光用户的比例而增加，因为该平台可能会战略性地提高其计费限制，以增加非订户的广告收入。
治疗时间的变化（即单位可以在不同的时间点进行治疗）
 治疗效果的异质性（即，参与治疗的效果可能因单位而异，并显示出潜在的复杂动态，选择治疗或时间效应）
 平行趋势假设仅在对协变量进行条件处理后成立
主要参数是组时平均治疗效果。 这些是特定时间段内特定组（组由治疗时间定义）的平均治疗效果。 这些参数是对被治疗的平均治疗效果（ATT）的自然概括，在教科书案例中有两个时期，两组有多个时期。
 分组时间平均治疗效果也是更综合的治疗效果参数（例如总体治疗效果或事件研究类型的估计值）的自然构成部分。
最近有一些关于DiD的工作，涉及多个时间段。 did包实现了提出的框架
 有关问题的更高级讨论，请参见
您可以使用以下命令从CRAN安装did ：
install.packages( " di
y = i + Xb + e
这里 y 是因变量上包含观测得分的向量， i 是表示y-截距的单位向量， X 是连续分布或分类（编码）自变量的矩阵， B 是回归权重向量， e 表示残差向量或误差或不能由模型解释的剩余得分。
SEM 由一系列多重回归方程组成 – 所有方程被