更改

跳到导航 跳到搜索
添加1,962字节 、 2022年3月4日 (五) 15:55
无编辑摘要
第11行: 第11行:  
编辑后:
 
编辑后:
   −
在统计学、计量经济学、政治学、流行病学和相关学科中,断点回归是一种准实验性的前后侧设计,其目的是通过设定一个临界值或阈值,其两侧即为干预效果的分配。通过比较临近阈值两侧的观测值,可以估计在随机化不可行的条件下的平均处理效果。然而,仅使用这种方法仍然不能做出完全的因果推断,因为它不会自动排除任何潜在混杂变量的因果效应。断点回归最初由唐纳德·西斯尔思韦特和唐纳德·坎贝尔应用于奖学金项目的评估,近年来越来越受到欢迎。最近的随机对照实验(RCTs)和RDDs的研究比较已经经验性地证明了该设计的内部有效性。
+
在统计学、计量经济学、政治学、流行病学和相关学科中,断点回归(RDD)是一种准实验性的前后侧设计,其目的是通过设定一个临界值或阈值,其两侧即为干预效果的分配。通过比较临近阈值两侧的观测值,可以估计在随机化试验不可行的条件下的平均处理效果。然而,仅使用这种方法仍然不能做出完全的因果推断,因为它不会自动排除任何潜在的混杂变量。RDD最初由唐纳德·西斯尔思韦特和唐纳德·坎贝尔应用于奖学金项目的评估,近年来越来越受到欢迎。最近的随机对照实验(RCTs)和RDD的研究比较已经经验性地证明了该设计的内部有效性。
    
== Example ==
 
== Example ==
第22行: 第22行:  
编辑后:
 
编辑后:
   −
= = 实例 = =通过对基于成绩的奖学金的评估,可以很好地说明RDD背后的直觉。估计这种干预的因果效应的主要问题是分配至处理组的样本的表现具有同质性(如:奖学金)。因为表现优异的学生更有可能获得优异奖学金,同时这些学生在未来将继续表现良好,因此比较获奖学金学生和未获奖学金学生的成绩,会使估计结果偏高。即使奖学金根本没有提高学生的成绩,获奖学金学生的成绩也会比没有获奖学金的成绩要好,这是因为奖学金是颁发给原本就表现良好的学生。
+
<nowiki>= = 实例 = =</nowiki>
 +
 
 +
通过对基于成绩来判断是否获得奖学金的一项评估,可以很好地说明RDD背后的直觉。估计这种干预的因果效应的主要问题是分配至处理组的样本的表现具有同质性(如:均获得奖学金或均未获得奖学金)。因为表现优异的学生更有可能获得优异奖学金,同时这些学生在未来将继续表现良好,因此比较获奖学金学生和未获奖学金学生的成绩,会使估计结果偏高。即使奖学金根本没有提高学生的成绩,获奖学金学生的成绩也会比没有获奖学金的成绩要好,这是因为奖学金是颁发给原本就表现良好的学生。
    
Despite the absence of an [[experimental design]], an RDD can exploit [[exogenous]] characteristics of the intervention to elicit [[causality|causal effects]]. If all students above a given grade — for example 80% — are given the scholarship, it is possible to elicit the local treatment effect by comparing students around the 80% cut-off. The intuition here is that a student scoring 79% is likely to be very similar to a student scoring 81% — given the pre-defined threshold of 80%. However, one student will receive the scholarship while the other will not. Comparing the outcome of the awardee (treatment group) to the [[Counterfactual conditional|counterfactual]] outcome of the non-recipient (control group) will hence deliver the local treatment effect.
 
Despite the absence of an [[experimental design]], an RDD can exploit [[exogenous]] characteristics of the intervention to elicit [[causality|causal effects]]. If all students above a given grade — for example 80% — are given the scholarship, it is possible to elicit the local treatment effect by comparing students around the 80% cut-off. The intuition here is that a student scoring 79% is likely to be very similar to a student scoring 81% — given the pre-defined threshold of 80%. However, one student will receive the scholarship while the other will not. Comparing the outcome of the awardee (treatment group) to the [[Counterfactual conditional|counterfactual]] outcome of the non-recipient (control group) will hence deliver the local treatment effect.
第32行: 第34行:  
编辑后:
 
编辑后:
   −
尽管缺乏一个实验设计,但一个RDD研究可以利用干预的外部特征来引出因果效应。如果给予所有特定分数以上的学生(如80分)奖学金,就能够通过比较在80分临界值附近的学生,得出局部处理效果。这里的经济学直觉是,一个得分79分的学生很可能与一个得分81分的学生非常相似--假设预先设定的阈值是80分。但不同的是,得分是81分的学生将获得奖学金,而79分的学生不会获得奖学金。将获得奖学金(处理组)的干预效果与未获得奖学金(对照组)的反事实处理效果进行比较,可以得到局部处理效果。
+
尽管缺乏一个实验设计,但一个RDD研究可以利用干预的外部特征来引出因果效应。如果给予所有特定分数以上的学生(如80分)奖学金,就能够通过比较在80分临界值附近的学生,得出局部处理效果。这里的经济学直觉是,一个得分79分的学生很可能与一个得分81分的学生非常相似--假设预先设定的临界值是80分。但不同的是,得分是81分的学生将获得奖学金,而79分的学生不会获得奖学金。将获得奖学金(处理组)的干预效果与未获得奖学金(对照组)的反事实处理效果进行比较,可以得到局部处理效果。
    
== Methodology ==
 
== Methodology ==
第41行: 第43行:  
= = 方法 = = 使用 RDD 进行估计的两种最常见的方法是非参数和参数(通常是多项式回归)。
 
= = 方法 = = 使用 RDD 进行估计的两种最常见的方法是非参数和参数(通常是多项式回归)。
   −
编辑后:= = 方法 = = 使用RDD进行估计的两种最常见的方法是参数方法和非参数方法(通常是多项式回归)。
+
编辑后:
 +
 
 +
<nowiki>= = 方法 = =</nowiki>
 +
 
 +
使用RDD进行估计的两种最常见的方法是参数方法和非参数方法(通常是多项式回归)。
    
=== Non-parametric estimation ===
 
=== Non-parametric estimation ===
第122行: 第128行:     
= = = 参数估计 = = = 参数估计的一个例子是: y = alpha + beta _ 1 x _ i + beta _ 2 c _ i + beta _ 3 c _ i ^ 2 + beta _ 4 c _ i ^ 3 + varepsilon,其中: x _ i = begin { cases }1 text { if } c _ i geq bar { c }0 text { if } c _ i < bar { c } end { cases }和 bar { c }是处理方法。注意,多项式部分可根据需要缩短或扩展。
 
= = = 参数估计 = = = 参数估计的一个例子是: y = alpha + beta _ 1 x _ i + beta _ 2 c _ i + beta _ 3 c _ i ^ 2 + beta _ 4 c _ i ^ 3 + varepsilon,其中: x _ i = begin { cases }1 text { if } c _ i geq bar { c }0 text { if } c _ i < bar { c } end { cases }和 bar { c }是处理方法。注意,多项式部分可根据需要缩短或扩展。
 +
 +
编辑后:
    
=== Other examples ===
 
=== Other examples ===
第137行: 第145行:  
* 将学生分类到治疗项目中的教育分数。
 
* 将学生分类到治疗项目中的教育分数。
 
编辑后:
 
编辑后:
 +
 +
<nowiki>= = 其他例子= =</nowiki>
    
由年龄资格标准确定干预与否的政策(如:养老金政策,最低法定饮酒年龄)
 
由年龄资格标准确定干预与否的政策(如:养老金政策,最低法定饮酒年龄)
第142行: 第152行:  
一个政治家以微弱优势获胜的选举。
 
一个政治家以微弱优势获胜的选举。
   −
在教育中的分数线将学生分类到干预项目中。
+
在教育研究领域中分数线将学生分类到干预项目中。
 
  −
 
      
== Required assumptions ==
 
== Required assumptions ==
第155行: 第163行:  
编辑后:
 
编辑后:
   −
= = 所需假设 = = 断点回归设计要求除了干预变量和结果变量之外,所有潜在的协变量在断点处均应是连续的,一个充分但不是必要的条件是,干预分配在临界值处“和随机分配一样好”。如果这种说法成立,那就保证了接受干预的样本与那些没有接受干预的样本是可比的,因为干预与否在断点处实际上是随机的。
+
<nowiki>= = 所需假设 = =</nowiki>
 +
 
 +
断点回归设计要求除了干预变量和结果变量之外,所有潜在的协变量在断点处均应是连续的,一个充分但非必要的条件是,干预分配在临界值处“和随机分配一样好”。如果这种说法成立,那就保证了接受干预的样本与那些没有接受干预的样本是可比的,因为干预与否在断点处实际上是随机的。
    
Treatment assignment at the threshold can be "as good as random" if there is randomness in the assignment variable and the agents considered (individuals, firms, etc.) cannot perfectly manipulate their treatment status. For example, suppose the treatment is passing an exam, where a grade of 50% is required. In this case, this example is a valid regression discontinuity design so long as grades are somewhat random, due either to the randomness of grading or randomness of student performance.
 
Treatment assignment at the threshold can be "as good as random" if there is randomness in the assignment variable and the agents considered (individuals, firms, etc.) cannot perfectly manipulate their treatment status. For example, suppose the treatment is passing an exam, where a grade of 50% is required. In this case, this example is a valid regression discontinuity design so long as grades are somewhat random, due either to the randomness of grading or randomness of student performance.
第164行: 第174行:     
编辑后:
 
编辑后:
 +
 +
如果分配变量和代理变量(个人、公司等)是随机的,那么代理变量由于不能完全控制干预分配会使RDD在临界值处变得“和随机试验一样好”。例如,假设一项干预是通过一个考试,考试成绩必须在总分的50%以上。在这种情况下,只要成绩是随机的--随机的评分标准或随机的学生表现,这个例子都是一个有效的RDD设计。
    
Students must not also be able to perfectly manipulate their grade so as to determine their treatment status perfectly. Two examples include students being able to convince teachers to "mercy pass" them, or students being allowed to retake the exam until they pass. In the former case, those students who barely fail but are able to secure a "mercy pass" may differ from those who just barely fail but cannot secure a "mercy pass". This leads to [[selection bias]], as the treatment and control groups now differ. In the latter case, some students may decide to retake the exam, stopping once they pass. This also leads to [[selection bias]] since only some students will decide to retake the exam.<ref name="Lee and Lemieux 2010">{{cite journal |last1=Lee |last2=Lemieux |title=Regression Discontinuity Designs in Economics |year=2010 |journal=[[Journal of Economic Literature]] |volume=48 |issue=2 |pages=281–355 |doi=10.1257/jel.48.2.281 |s2cid=14166110 |url=http://arks.princeton.edu/ark:/88435/dsp015138jd866 }}</ref>
 
Students must not also be able to perfectly manipulate their grade so as to determine their treatment status perfectly. Two examples include students being able to convince teachers to "mercy pass" them, or students being allowed to retake the exam until they pass. In the former case, those students who barely fail but are able to secure a "mercy pass" may differ from those who just barely fail but cannot secure a "mercy pass". This leads to [[selection bias]], as the treatment and control groups now differ. In the latter case, some students may decide to retake the exam, stopping once they pass. This also leads to [[selection bias]] since only some students will decide to retake the exam.<ref name="Lee and Lemieux 2010">{{cite journal |last1=Lee |last2=Lemieux |title=Regression Discontinuity Designs in Economics |year=2010 |journal=[[Journal of Economic Literature]] |volume=48 |issue=2 |pages=281–355 |doi=10.1257/jel.48.2.281 |s2cid=14166110 |url=http://arks.princeton.edu/ark:/88435/dsp015138jd866 }}</ref>
第173行: 第185行:  
编辑后:
 
编辑后:
   −
学生也不能操纵他们的分数,从而决定自己的干预状态。举两个例子,学生说服老师使其通过分数线,或学生被允许重新参加考试。前一种情况下,那些没有通过分数线但是说服了老师的学生不同于那些没有通过分数线也没有说服老师的学生。这产生了选择偏差,因为现在干预组和控制组的学生存在差别,即潜在的协变量在两组学生中是不连续的,不满足以上假设。后一种情况下,一些学生可能决定重新参加考试,一旦通过就停止重考,这也导致了选择偏差,因为只有一部分学生会决定重新参加考试,即那些第一次就未通过分数线的学生。
+
同时学生不能操纵他们的分数,从而改变自己的干预状态。举两个例子,学生说服老师使其通过分数线,或学生被允许重新参加考试。前一种情况下,那些没有通过分数线但是说服了老师的学生不同于那些没有通过分数线也没有说服老师的学生。这产生了选择偏差,因为现在干预组和控制组的学生存在差别,即潜在的协变量在两组学生中是不连续的,不满足以上假设。后一种情况下,一些学生可能决定重新参加考试,一旦通过就停止重考,这也导致了选择偏差,因为只有一部分学生会决定重新参加考试,即那些第一次就未通过分数线的学生。
    
=== Testing the validity of the assumptions ===
 
=== Testing the validity of the assumptions ===
第181行: 第193行:     
如果代理人能够完美地确定他们的待遇状态,那么就不可能确切地检验这些假设的有效性。然而,一些测试可以提供证据支持或折扣回归不连续设计的有效性。
 
如果代理人能够完美地确定他们的待遇状态,那么就不可能确切地检验这些假设的有效性。然而,一些测试可以提供证据支持或折扣回归不连续设计的有效性。
 +
 +
编辑后:
 +
 +
如果代理变量能够确定他们的干预状态,那么就不可能准确地检验这些假设的有效性。幸运的是,一些测试可以提供证据支持或忽视RDD设计的有效性。
    
==== Density test ====
 
==== Density test ====
[[File:McCrary (2008) Density Test on Data from Lee, Moretti, and Butler (2004).png|thumb|McCrary (2008)<ref name="McCrary 2008" /> density test on data from Lee, Moretti, and Butler (2004).<ref name="Lee Moretti Butler 2004" />]]
+
[[File:McCrary (2008) Density Test on Data from Lee, Moretti, and Butler (2004).png|thumb|McCrary (2008)<ref name="McCrary 2008" /> density test on data from Lee, Moretti, and Butler (2004).<ref name="Lee Moretti Butler 2004" />|链接=Special:FilePath/McCrary_(2008)_Density_Test_on_Data_from_Lee,_Moretti,_and_Butler_(2004).png]]
 
McCrary (2008) suggested examining the density of observations of the assignment variable.<ref name="McCrary 2008">{{cite journal |last=McCrary |title=Manipulation of the Running Variable in the Regression Discontinuity Design: A Density Test |year=2008 |journal=[[Journal of Econometrics]] |volume=142 |issue=2 |pages=698–714 |doi=10.1016/j.jeconom.2007.05.005 |citeseerx=10.1.1.395.6501 }}</ref> Suppose there is a discontinuity in the density of the assignment variable at the threshold for treatment. In this case, this may suggest that some agents were able to manipulate their treatment status perfectly.
 
McCrary (2008) suggested examining the density of observations of the assignment variable.<ref name="McCrary 2008">{{cite journal |last=McCrary |title=Manipulation of the Running Variable in the Regression Discontinuity Design: A Density Test |year=2008 |journal=[[Journal of Econometrics]] |volume=142 |issue=2 |pages=698–714 |doi=10.1016/j.jeconom.2007.05.005 |citeseerx=10.1.1.395.6501 }}</ref> Suppose there is a discontinuity in the density of the assignment variable at the threshold for treatment. In this case, this may suggest that some agents were able to manipulate their treatment status perfectly.
   第190行: 第206行:     
= = = = 密度测试 = = = 拇指 | McCrary (2008)对 Lee,Moretti 和 Butler (2004)的数据进行密度测试。McCrary (2008)建议检查分配变量的观测密度。假设在处理的阈值处赋值变量的密度存在不连续性。在这种情况下,这可能表明一些药物能够完美地操纵他们的治疗状态。
 
= = = = 密度测试 = = = 拇指 | McCrary (2008)对 Lee,Moretti 和 Butler (2004)的数据进行密度测试。McCrary (2008)建议检查分配变量的观测密度。假设在处理的阈值处赋值变量的密度存在不连续性。在这种情况下,这可能表明一些药物能够完美地操纵他们的治疗状态。
 +
 +
编辑后:
 +
 +
<nowiki>= = = = 密度测试 = = =</nowiki>
 +
 +
McCrary (2008)对Lee,Moretti & Butler (2004)的数据进行了密度测试。McCrary (2008)建议检查分配变量的观测值密度。假设在干预的临界值处赋值变量的密度存在不连续性。在这种情况下,这可能表明一些代理变量能够改变他们的干预状态。
    
For example, if several students are able to get a "mercy pass", then there will be more students who just barely passed the exam than who just barely failed. Similarly, if students are allowed to retake the exam until they pass, then there will be a similar result. In both cases, this will likely show up when the density of exam grades is examined. "Gaming the system" in this manner could bias the treatment effect estimate.
 
For example, if several students are able to get a "mercy pass", then there will be more students who just barely passed the exam than who just barely failed. Similarly, if students are allowed to retake the exam until they pass, then there will be a similar result. In both cases, this will likely show up when the density of exam grades is examined. "Gaming the system" in this manner could bias the treatment effect estimate.
第199行: 第221行:  
编辑后:
 
编辑后:
   −
例如,如果一些学生说服老师通过了成绩,那么勉强通过考试的学生数量会比勉强未通过考试的学生多。同样的,如果允许学生重新参加考试直到他们通过,也会有类似的结果。在这两种情况下,
+
例如,如果一些学生说服老师通过了成绩,那么勉强通过考试的学生数量会比差点通过考试的学生多。同样地,如果允许学生重新参加考试直到他们通过,也会有类似的结果。在这两种情况下--可以通过检查考试成绩在临界值处的密度,“博弈系统”可能会对干预效果的估计产生偏差。
    
==== Continuity of observable variables ====
 
==== Continuity of observable variables ====
第212行: 第234行:  
<nowiki>= = = = 可观测变量的连续性= = = =</nowiki>  
 
<nowiki>= = = = 可观测变量的连续性= = = =</nowiki>  
   −
由于断点回归设计的有效性依赖于那些受到干预的样本和未受到干预的样本特征的相似性,所以检查这些样本是否具有相同的可观测变量是有意义的。对于前面的例子,我们可以测试那些通过分数线的学生和那些未通过分数线的学生是否有不同的特征(人口统计资料、家庭收入等)。虽然一些变量可能会因为随机原因而有所不同,但大多数变量应该是相同的。
+
由于RDD设计的有效性依赖于那些受到干预的样本和未受到干预的样本特征的相似性,所以检查这些样本是否具有相同的可观测变量值是有意义的。对于前面的例子,我们可以测试那些通过分数线的学生和那些未通过分数线的学生是否有相同的特征(人口统计资料、家庭收入等)。虽然一些变量可能会因为随机因素而有所差异,但大多数变量应该是相似的。
    
==== Falsification tests ====
 
==== Falsification tests ====
第231行: 第253行:  
<nowiki>= = = = = 事前变量 = = = = = =</nowiki>
 
<nowiki>= = = = = 事前变量 = = = = = =</nowiki>
   −
类似于可观测变量的连续性,事前变量在临界值处也将是连续的,因为这些变量是在干预之前就已经确定的,干预状态不会影响他们。考虑之前基于考试成绩来确定是否获得奖学金的例子,如果感兴趣的结果变量是未来的成绩,那奖学金不会影响事前就已经确定的考试成绩。如果事前变量在临界值处是不连续的,那断点回归的有效性将成为问题。
+
类似于可观测变量的连续性,事前变量在临界值处也将是连续的,因为这些变量是在干预之前就已经确定的,干预状态不会影响他们。考虑之前基于考试成绩来确定是否获得奖学金的例子,如果感兴趣的结果变量是未来的成绩,那奖学金不会影响事前就已经确定的考试成绩。如果事前变量在临界值处是不连续的,那RDD的有效性将成为问题。
    
===== Other discontinuities =====
 
===== Other discontinuities =====
第241行: 第263行:     
编辑后:
 
编辑后:
 +
 +
<nowiki>= = 其他非连续性= =</nowiki>
 +
 +
如果在分配变量的其他点存在不连续性,那么这可能使RDD设计受到质疑。以Carpenter and Dobkin(2011)为例,他们研究了美国饮酒合法化的影响。随着21岁人群接触酒精的机会增加,这会导致各种变量结果的改变,如死亡率和发病率。如果死亡率和发病率在其他年龄段也不连续地增加,那么21岁时这种不连续性的解释就成为问题。
    
==== Inclusion and exclusion of covariates ====
 
==== Inclusion and exclusion of covariates ====
第250行: 第276行:     
编辑后:
 
编辑后:
 +
 +
<nowiki>= = 包含和排除哪些协变量= =</nowiki>
 +
 +
如果参数估计对排除或增加模型的协变量很敏感,
    
Recent work has shown how to add covariates, under what conditions doing so is valid, and the potential for increased precision.<ref>{{cite arXiv|last1=Calonico|last2=Cattaneo|last3=Farrell|last4=Titiunik|title=Regression Discontinuity Designs Using Covariates|date=2018|eprint=1809.03904|class=econ.EM}}</ref>
 
Recent work has shown how to add covariates, under what conditions doing so is valid, and the potential for increased precision.<ref>{{cite arXiv|last1=Calonico|last2=Cattaneo|last3=Farrell|last4=Titiunik|title=Regression Discontinuity Designs Using Covariates|date=2018|eprint=1809.03904|class=econ.EM}}</ref>
39

个编辑

导航菜单