来源:沪港发展联合研究所 +收藏本文



「选题人」 偶然读到Cornell University助理教授Alexandra Cirone的短文,谈到了关于IV方法在历史政治学中的应用和进展,受益不少。特别请书茗做了翻译。涉及不少计量经济学术语,不精准之处,请大家指正。




图片

来源:“A good instrument is hard to find”, Broadstreet, 9 April 2021, https://broadstreet.blog/2021/04/09/a-good-instrument-is-hard-to-find/



好的工具变量寻之不易


无论身处哪个学科领域,估计因果效应都并非易事。HPE(Historical Political Economy, 即历史政治经济学)研究的一个重要特点就是数据可观测,作为研究者的我们无法控制处理分配(treatment assignment)。


今天,我要讨论的话题是工具(instruments)。对于在HPE领域进行了因果干预的研究者来说,工具变量(instrumental variable,IV)分析法是一个潜在的识别策略。如果我们感兴趣的自变量(即预设的处理变量)是内生的,那么我们就得试着找到第三个“近似随机”的变量,以助于决定在处理条件中的选择——这个第三变量就是工具变量。好的工具变量往往能成就极其出色的论文。

看上去的确很不错,但工具变量法实际上很容易受诟病。这一方面是因为我们需要使识别策略满足排他性约束,而这一条件无法进行统计性检验(并且有许多可以模糊处理的空间);另一方面是因为一些“天真”学者认为工具变量分析易于完成,而实际上并非如此,有时候寻找历史工具变量是很复杂的事情。

但也不要太担忧,毕竟凡事预则立...


HPE研究的排他性约束


让我们先从困难的部分开始。

研究设计中有很多可识别的假设,但其中最突出的是工具变量法假设该变量只通过其与自变量的关系来影响因变量。这就是“恶名昭著”的“排他性约束”,这也正是采用工具变量法的研究能否成功的关键。我无意浪费时间从头讲起,只是想要指出在历史研究中应用工具变量法,还需要面对一些额外的挑战。

首先需要记住的是,相比于短期,有时候排他性约束在长期更难合理化。如果潜在的工具变量在多重时点与暴露变量相关,那么将会有多种导向结果的路径(并且可能有更多违背排他性约束的情况)。或者如果协变量的滞后值被用作工具变量,并且协变量效应的结果是长期持续的,那么又会存在一个识别问题(更具体一点,研究历史移民、民族语言分化或宗教的人一定得读Gallen和Raymond撰写的工作论文《Broken Instruments》)。

总的来说,在几十年的历史中识别混淆变量和因果关系也实属不易,更何况我们还经常低估了干扰措施所产生的下界效应(downstream effects)。

读者们应该意识到存在“后工具变量偏差”,可以阅读一下Glynn和Rueda的相关论文《Post-Instrument Bias》)。他们在这篇文章中指出:诚然,研究者通常考虑了后工具变量协变量以满足排他性约束,但这实际抵消了自然实验的全部好处。

任何排他性约束都必须以特定的研究话题知识为依据,而最好的辩护通常包括历史主要来源证据、创意性的描述数据和其他领域的引用。幸运的是,这类研究通常是HPE学者大放异彩的地方(尽管数据缺失和历史记录不足也可能使满足排他性约束变得更加困难)。

最后,值得一提的是,大受欢迎的工具变量常被用来预测许多不同的事情,而这一事实正好表明它们很可能违反了排他性约束(尽管对于更难被找到的历史工具变量而言,这可能不算什么大问题)。例如,降雨量便是一种非常受欢迎的外生工具变量。Jon Mellon那篇精彩的论文《Rain, Rain, Go Away…》中证明了这一点。他回顾了185项社会科学研究,发现了137个与天气相关的不同变量(这还只是保守估计)。他还为读者提供了步骤,指导如何通过系统地回顾使用受欢迎的工具变量的现有文献,来寻找潜在的违背排他性约束的研究行为。

有时候批判工具变量并不难,但是如果你阅读了这些批评的评论本身,你将会有更多机会来了解你将要面临的挑战。


如何找到好的工具变量?


如何为历史研究找到一个好的工具变量?

最有效的建议自然是要非常熟悉你的研究话题(可以阅读Thad Dunning关于自然实验的教材,这样你的潜意识就会知道寻找的方向)。不论如何,关于排他性约束的论证需要详尽的知识支持,但有时完美的工具变量会在做背景调查的过程中被发掘。举个例子,我和我的合著者在研究中使用了基于抽签的程序作为工具变量,以估计委员会服务对职业生涯的因果效应——我当时正在档案馆里读一本19世纪的法国书籍,然后从中偶然得到了工具变量的灵感。

另一个不错的建议直接来源于Scott Cunningham的书《Causal Inference: The Mixtape》。他写道:“满足排他性约束的工具变量的一个必要不充分条件是,当你告诉人们 Zi(工具变量)和 Yi(结果变量)的关系时,他们对此感到困惑 …… 工具变量可能显得格格不入...因为 Zi 与 Yi 看起来很不协调。如果二者协调,这大概意味着排他性约束被违背了。但是,如果二者不太协调,并且使得人们对此感到困惑,那么这至少有潜力成为还不错的工具变量。”
或者,你也可以通过阅读一些历史工具变量的文章来获得灵感,我在下面列举了一些我收藏的:

Nunn (2008): 着眼于奴隶贸易对非洲经济发展影响的研究;使用与主要奴隶港口的距离作为衡量奴隶贸易强度的工具变量。


Dube and Harish (2020): 研究了15至20世纪的欧洲女王更爱发动战争的原因;利用“前君主”第一个出生的孩子的性别和君主姊妹作为女王统治的工具变量。


Acharya, Blackwell, Sen (2018): 考察了1860年的奴隶制是如何与当今的政治态度和党派相关联的;利用棉花的适宜度作为奴隶制盛行的工具变量。


Biavaschi, Giulietti, and Siddique (2017): 着眼于移民如何“美国化”其姓名以改善其职业前景;使用基于拼字游戏点的语言复杂性指数作为预测姓名美国化的工具变量。


Cirone and van Coppenolle (2018): 研究了预算委员会的服务如何影响长期的政治生涯;使用以抽签为基础的程序作为委员会选举的工具变量。



Kern and Hainmueller (2009): 分析了观看西德电视节目是否会弱化东德公民对共产主义政权的支持;采用区级是否收看西德电视广播作为工具变量。



Gihleb and Giuntella (2017): 研究了天主教学校出勤率对于提高学生成绩的影响;利用女性宗教职业的人数突然减少(源于第二次梵蒂冈会议的改革)作为天主教学校教育的工具变量。



图片

资料来源:https://www.loc.gov/item/2016854431/




如果你想要用好工具变量


对于历史研究来说,工具变量法是完全可行的识别策略。但是以下是需要记住的一些事项:

在你的论文中单独列出一个部分来讨论识别假设。虽然你不能“证明”排他性约束,但你可以提供描述性数据或历史依据(引用其他领域)来支持对因果模型的解释。前文提到的Glynn和Rueda的论文收集了前三大政治科学期刊(APSR、AJPS和JOP)有关工具变量的论文数据,他们发现在155篇使用工具变量的论文中,只有116篇明确讨论了排他性约束。那么其他人在做什么?——没人知道。

不要 不明显地在文中加入工具变量这部分讨论。这不是一种容易论证的识别策略,也不应该被视为稳健型检验。一个孤零零的段落和后面的回归表不会让你顺利通过顶级期刊的审稿(而且更有可能意外地让审稿人觉得你不懂这个方法)。

在同一篇文章中考虑其他可选的估计策略。为了更好理解工具变量法中的偏差和潜在的违背排他性约束的行为,讨论或包括像OLS这样的“原始”规范是非常重要的;也可以对模型之间的差异进行富有成效的讨论。

不要 只是因为你想在摘要中使用“因果”一词而使用“工具变量”。对于观测数据,还有其他的识别策略,比如双重差分法、断点回归法、匹配法、合成控制法,而一个表现不佳的工具变量并不是因果关系识别。

试着喜欢有向无环图(DAGs, directed acyclic graphs)——这可以帮助你预测违背排他性约束的情况,并更好地帮助你理解自己的研究。

最后,一个为阅读这篇文章的研究生准备的百试不爽的法则:当一个老师用“工具变量”一词来转发一些貌似合理的外生事件或世界上的意外事件时,他有80%的几率是在讽刺——别怪我没提醒你。