合成对照

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索


合成对照 synthetic control method是一种统计方法,在比较案例研究中用于评估干预措施的效果。它使用多组数据的加权组合来构建对照组,使之与治疗组进行比较。[1]基于这种比较,可用来估计在干预之后的时间里,假如没有对治疗组进行干预的情况下治疗组将如何发展。


双重差分方法 Difference in difference不同,这种方法可以考虑混杂因素随时间变化的影响,通过调整对照组的加权组合,可以对干预之前的治疗组数据做更好的匹配。[2]合成对照还有个优点是,它允许研究人员在多组候选数据中做系统性选择。[3]它已应用于政治学[3]、卫生政策[2]、犯罪学[4]和经济学等多个领域。[5]


合成对照方法结合了匹配方法和双重差分方法的技术要素。双重差分法也是一种常用的政策评估工具,通过比较被干预单元和未被干预单元在总体水平上(例如:州、国家、年龄组别等)的均值差异来评估政策干预效果。著名的案例包括新泽西州快餐店提高最低工资政策对就业影响的研究,[6]比较对象是在新泽西州边界另一侧,费城那边那些没受到该政策影响的快餐店;还有通过研究南部城市的犯罪率来评估马里埃尔移民潮如何影响犯罪的案例。[7]在双重差分场景中,合成对照的控制组可被理解为一个加权平均,其中的一些单元相当于得到了零权重,而另外的一些单元则得到了非零权重(每个单元内的数据共享同一权重值)。


合成对照方法试图用一种更加系统的方法为控制组分配权重。它通常用干预之前比较长一段时间内的多个时间序列作为输入数据,估计一组权重值使得这些输入数据加权的结果尽可能地拟合治疗组的时间序列数据,并将结果用作控制组时间序列数据。特别地,假设我们在T个时间段里共有J个观测量(单元),其中一个单元在[math]\displaystyle{ T_{0} }[/math]时间接受了治疗,[math]\displaystyle{ T_{0}\lt T }[/math]。让

[math]\displaystyle{ \alpha_{it}=Y_{it}-Y^N_{it}, }[/math]

为单元[math]\displaystyle{ i }[/math]的在时间[math]\displaystyle{ t }[/math]的治疗效果,其中[math]\displaystyle{ Y^N_{it} }[/math]是未经治疗的结果。不失一般性,如果指定单元1接受治疗,则只有单元1的数据[math]\displaystyle{ Y^N_{1t} }[/math][math]\displaystyle{ t\gt T_{0} }[/math]时段是无法观测的。而我们的目标是要估计[math]\displaystyle{ (\alpha_{1T_{0}+1}......\alpha_{1T}) }[/math]的值。


强加一些结构

[math]\displaystyle{ Y^N_{it}=\delta_{t}+\theta_{t}Z_{i}+\lambda_{t}\mu_{i}+\varepsilon_{it} }[/math]

假设存在一些最优权重[math]\displaystyle{ w_2, \ldots, w_J }[/math],使得

[math]\displaystyle{ Y_{1t} = \Sigma^J_{j=2} w_{j}Y_{jt} }[/math]


而对于[math]\displaystyle{ t\leqslant T_{0} }[/math],合成对照方法建议使用这些权重来做出反事实估计

[math]\displaystyle{ Y^N_{1t}=\Sigma^J_{j=2}w_{j}Y_{jt} }[/math]

因此,在一定的正则性条件下,此类权重可以作为我们所关心的治疗效果的估计量。本质上,该方法基于匹配的思想,利用干预前的数据训练得到加权组合的控制组,进而可以对干预后的控制组数据进行推断。[8]


合成对照已经被应用于许多实证研究中,从研究自然灾害和经济增长,[9]到研究政治谋杀与房价之间的联系。[10]


参考文献

  1. Abadie, Alberto (2021). "Using Synthetic Controls: Feasibility, Data Requirements, and Methodological Aspects". Journal of Economic Literature (in English). 59 (2): 391–425. doi:10.1257/jel.20191450. ISSN 0022-0515.
  2. 2.0 2.1 Kreif, Noémi; Grieve, Richard; Hangartner, Dominik; Turner, Alex James; Nikolova, Silviya; Sutton, Matt (December 2016). "Examination of the Synthetic Control Method for Evaluating Health Policies with Multiple Treated Units". Health Economics. 25 (12): 1514–1528. doi:10.1002/hec.3258. PMC 5111584. PMID 26443693.
  3. 3.0 3.1 Abadie, Alberto; Diamond, Alexis; Hainmueller, Jens (February 2015). "Comparative Politics and the Synthetic Control Method". American Journal of Political Science. 59 (2): 495–510. doi:10.1111/ajps.12116.
  4. Saunders, Jessica; Lundberg, Russell; Braga, Anthony A.; Ridgeway, Greg; Miles, Jeremy (3 June 2014). "A Synthetic Control Approach to Evaluating Place-Based Crime Interventions". Journal of Quantitative Criminology. 31 (3): 413–434. doi:10.1007/s10940-014-9226-5.
  5. Billmeier, Andreas; Nannicini, Tommaso (July 2013). "Assessing Economic Liberalization Episodes: A Synthetic Control Approach". Review of Economics and Statistics. 95 (3): 983–1001. doi:10.1162/REST_a_00324.
  6. Card, D.; Krueger (1994). "Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania". American Economic Review. 84 (4): 772–793. JSTOR 2118030.
  7. Card, D. (1990). "The Impact of the Mariel Boatlift on the Miami Labor Market". Industrial and Labor Relations Review. 43 (2): 245–257. doi:10.1177/001979399004300205.
  8. Abadie, A.; Diamond, A.; Hainmüller, J. (2010). "Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California's Tobacco Control Program". Journal of the American Statistical Association. 105 (490): 493–505. doi:10.1198/jasa.2009.ap08746.
  9. Cavallo, E.; Galliani, S.; Noy, I.; Pantano, J. (2013). "Catastrophic Natural Disasters and Economic Growth" (PDF). Review of Economics and Statistics. 95 (5): 1549–1561. doi:10.1162/REST_a_00413.
  10. Gautier, P. A.; Siegmann, A.; Van Vuuren, A. (2009). "Terrorism and Attitudes towards Minorities: The effect of the Theo van Gogh murder on house prices in Amsterdam". Journal of Urban Economics. 65 (2): 113–126. doi:10.1016/j.jue.2008.10.004.


编者推荐

集智课程

因果科学读书会第三季:因果+X

“因果”并不是一个新概念,而是一个已经在多个学科中使用了数十年的分析技术。通过前两季的分享,我们主要梳理了因果科学在计算机领域的前沿进展。如要融会贯通,我们需要回顾数十年来在社会学、经济学、医学、生物学等多个领域中,都是使用了什么样的因果模型、以什么样的范式、解决了什么样的问题。我们还要尝试进行对比和创新,看能否以现在的眼光,用其他的模型,为这些研究提供新的解决思路。


“因果+X”就是要让因果真正地应用于我们的科学研究中,不管你是来自计算机、数理统计领域,还是社会学、经济学、管理学领域,还是医学、生物学领域,我们希望共同探究出因果研究的范式,真正解决因果的多学科应用问题,乃至解决工业界的问题。



本中文词条由Aceyuan审校,薄荷编辑,如有问题,欢迎在讨论页面留言。


本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。