更改

添加11,710字节 、 2022年8月14日 (日) 16:47
第2行: 第2行:  
|keywords=因果推断,统计技术
 
|keywords=因果推断,统计技术
 
|description=是一种应用于因果推断的统计技术
 
|description=是一种应用于因果推断的统计技术
}}
+
}}本词条尚未编辑完毕
    
== 研究动机 ==
 
== 研究动机 ==
第163行: 第163行:     
== 主分层的关键假设 ==
 
== 主分层的关键假设 ==
 +
基于主要分层的分析分为三个阶段。第一阶段是确定我们前面描述的主要层次。总的来说,这个过程涉及到以一种相对高层次的方式思考实质性问题。下一阶段是将这些层次正式化,并编码进一步的实质性信息,以便日后进行估计。我们将在本节中讨论前两个阶段。最后一个阶段是估算,在第四部分中讨论。
 +
 +
首先,为了更好地界定地层,我们需要对随机试验的工作方式做一些假设。主要分层是基于潜在结果框架(Frangakis & Rubin,2002; Neyman,1923; Rubin,2005) ,它有效地考虑了每个研究个体具有个体的潜在结果和相关的潜在治疗效果。人 i,Yi (1)和 Yi (0)的潜在结果是我们可能看到的结果,如果我们治疗或不治疗的人,分别。
 +
 +
鉴于这些数值,一个关键的感兴趣的数量,整体平均治疗效果,是这些个别治疗效果的平均值。
 +
 +
因果影响是明确的,不依赖于任何分布或抽样假设: 人口由个人在实验中,而不是更多。挑战在于,虽然所有的潜在结果都已确定,但根据随机治疗分配,对于每个人来说,实际上只观察到一个潜在结果。
 +
 +
为了从这些基本定义出发,我们首先做出两个普遍接受的假设。首先,治疗实际上是随机的,我们将其表述为一个独立的假设,在个体是否接受治疗和个体的潜在结果是什么之间。第二个,通常被称为稳定单位治疗价值假设(SUTVA)(Rubin,1978,1980,1990) ,有效地说明治疗一个人不会影响另一个人(即,治疗一个学生没有溢出效应,不会帮助其他学生)。对于那些不熟悉潜在结果框架,我们建议 Angrist 等人的研究(1996年) ,其中讨论了这种情况下的不遵守。进一步的讨论,见 Imbens 和 Rubin (2015)或 Rosenbaum 的前三分之一(2010)。
 +
 +
上述假设为我们提供了明确的地层和明确的治理效果在每一个层。推理如下: 给定 SUTVA,个体对任何一种实验条件的反应本质上是个体的特征。这反过来又意味着,每个个体的成员阶层在本质上是个体的特征。鉴于治疗分配是随机的,它与阶层成员无关。因此,阶层内治疗效果是因果效应,就像其他亚组治疗效果一样。随着地层和地层水平处理效应的确定,我们进入下一阶段,我们增加了实质性的假设,对地层施加约束。这些限制非常重要,因为如果没有这些限制,通常很难在估计关键的利息数量方面取得进展。更重要的是,假设使我们能够正式地将我们对问题的实质性知识纳入我们的分析。这是主要分层框架的一个特别好处。在讨论前面提到的主体分层的其他设置之前,我们简要讨论了在标准不遵从性、单调性和排除限制的背景下最常见的两个假设
 +
 +
=== 二元不遵从语境中的单调性和排除限制 ===
 +
人们实际上如何回应随机提出采取给定的干预措施。单调性是这样一种假设,即一个人至少有可能接受分配给治疗条件的治疗,就像分配给控制条件的治疗一样。回到图1,其中显示了在纽约市学校教育券实验的背景下为二元不遵守建立的主要分层,单调性假设排除了任何“违背者”的可能性,因为这个阶层的儿童会在没有教育券提供但没有教育券提供的情况下进入私立学校。
 +
 +
 +
第二个主要假设是排除限制,它涉及到分配到治疗条件将如何影响那些实际上不接受治疗的个人,如果提供的话。同样,在图1所示的例子的上下文中,这些孩子的学校类型将被随机优惠券提供保持不变。总是接受教育的学生总是进入私立学校,有或没有教育券,而从不接受教育的学生总是进入公立学校。鉴于随机化不会改变这些亚组儿童的学校教育类型,我们假设随机化同样不会影响这些儿童的后续结果。同样地,我们假设,在这些地层中,治疗的效果为零
 +
 +
 +
重要的是,这些假设本质上是实质性的,而非统计性的。因此,至关重要的是通过推理来判断这些假设在每个实质性应用的背景下是否合理。就代金券研究而言,单调性似乎完全合理,因为很难想象一个学生或家庭在没有代金券提供的财政援助的情况下更有可能接受私立学校教育。然而,对于总是接受者和从不接受者的排除限制值得进一步考虑。绝不接受的是那些不管有没有优惠券都会去上公立学校的孩子。由于这些儿童的学校环境和实际的学校建筑很可能没有改变,因此可以合理地假设,治疗方案不会影响随后与学校有关的结果。然而,对于总是接受教育的人来说,可以想象的是,教育券的提供可能导致家庭为子女选择不同的私立学校。如果优惠券允许一些家庭选择进入更高质量的私立学校,那么总是接受优惠券的学生的待遇效果可能不会为零。有鉴于此,研究必须严格考虑并捍卫排除限制对总是服药者的适用或不适用这一假设,而是估计对这一亚群的治疗效果。正如我们在下面的评估部分中所讨论的,这些假设在某些情况下可以被测试。
    
== 估计随机试验中的关键主要因果效应 ==
 
== 估计随机试验中的关键主要因果效应 ==
 +
正如上述讨论所表明的,主层的定义和实质性的假设,以限制这些地层的特点是没有参考或事先估计。在我们看来,这种分离是利用主要分层框架的一个有益的方面: 第一个表达兴趣的组和数量,第二个确定可能有助于进一步限制或通知这些数量的实质性知识(例如假设) ,然后才能评估估计是否可能以及如何可能。简而言之,估算过程是独立的,有别于阐明这些数量的估算过程。根据对问题施加的约束,可以采取不同的一般策略进行估计。这些策略可以分为基于矩的方法(非参数)和基于模型的方法。首先,我们纯粹依赖于我们最初的假设来表达目标数量(例如地层特定的平均处理效应)作为数据的直接可观察特征的函数。当这不可能实现时,可以削弱基于矩的方法,转而试图约束目标数量。第二种方法是直接对部分或全部数据建模。这通常需要对主要阶层的结果做出分布假设,并利用基线协变量来预测个人的阶层成员。
 +
 +
我们把第一种方法称为“基于时刻”,因为我们可以根据可估计的“时刻”或数量(如平均值和比例)来估计相关的特定层次的治疗效果。第二种方法是“基于模型的”,因为我们的评估过程涉及
 +
 +
从铰接模型估计参数(Imbens & Rubin,1997)。这两种方法之间的关键区别在于,基于矩的方法只使用样本级信息,而基于模型的方法使用个体级信息,正如我们下面所讨论的。在不遵从的情况下,第一种策略可能对应用的定量研究者更为熟悉,而与第二种策略相关的工具和程序对于在更复杂的主体分层应用中估计主要因果效应通常是必要的。关于比较这两种方法的教科书讨论,参见 Imbens 和 Rubin (2015)。还可以看到 Stuart,Perry,Le 和 Ialongo (2008)的介绍。这两种通用的方法有不同的优点和缺点。基于矩的非参数方法依赖于较弱的假设,并允许考虑的结果的非标准和未知的分布形式。然而,这种结构的缺乏使得解开许多地层变得更加困难。至少在原则上,基于模型的方法可以分离出多层,以便洞察治疗影响的复杂模式。然而,重要的是,基本的分析工作是分离混合物之一ーー这是一个出了名的困难问题ーー而且这样做可能有些微妙,因为治疗效果的估计可能对建模选择敏感
    
== 主分层框架的好处和局限性 ==
 
== 主分层框架的好处和局限性 ==
 +
主要分层框架为审议诸如前面例子中强调的那些重要的反事实问题提供了一些好处。首先,框架的使用需要非常清晰地阐明与特定研究问题相关的实验对象在治疗和控制下所采取的后随机化经验、决定或行动。这本身就很有用。其次,在确定了相关地层之后,该框架还突出了估计治疗效果所依赖的假设。例如,在上述应用中,单调性假设排除了某些地层的存在和排除限制,固定处理效应在某些地层为零。
 +
 +
主体分层框架有利于培养对利益关键数量界定的清晰思维。然而,估算的过程相对不那么简单。尽管如此,一些标准模型已经得到了很好的理解,例如处理二元不遵从性的应用程序,以及单调性和排除限制假设实质上是站得住脚的。在这里,基于矩的 IV 是一个经典的解决方案,基于模型的 IV 产生了非常相似的 ITTc 估计值(Imbens & Rubin,1997)。在样本量大、编制者比例高的情况下,这种等效性通常是正确的。在这种情况下,一个合理的问题是为什么
 +
 +
更复杂的基于模型的 IV?一个原因是,如果提出的参数模型近似正确(这里,最重要的是,阶层结果分布是正态分布) ,基于模型的方法可以导致更精确的估计(Imbens & Rubin,1997)。然而,更重要的是,基于模型的方法提供了一个灵活的框架,可以在其中处理额外的分析复杂性,例如缺少数据和放松某些建模假设的需要。例如,使用基于模型的方法,我们可以通过允许 ITTa 为非零来评估 ITTc 的估计对于从未接受者的排除限制的敏感性。回顾上文关于总是接受私立学校教育券的学生可能有机会进入更好的私立学校的讨论。正如预期的那样,模型的稳定性通常随着额外假设的施加而增加,但在许多情况下,这种类型的灵敏度检查可以用来说明 ITTc 的估计对这种排除限制并不特别敏感(Hirano,Imbens,Rubin,& Zhou,2000)。基于模型的方法的最后一个好处,也是对于上面讨论的主体分层的一些更复杂的应用来说特别重要的一个好处,就是它很容易扩展到利益层不再由二元变量定义的环境(如上面的开端和职业学院的例子) ,以及单调性和排除限制不是有效假设的环境(如上面的工作团队的例子)。这种分析策略有潜在的缺点。首先,基于模型的方法可以对模型的偏离敏感。第二,对于基于模型的 IV 估计没有一个封闭的解决方案,这会使估计过程看起来不透明,难以向从业人员解释,并且难以执行计算。最后,正如我们前面所描述的,基于模型的方法将结果纳入到地层成员的预测中。虽然从贝叶斯的角度来看是明智的,但这可能是一种强行推销。然而,我们指出,结果对建模选择的敏感性并不是像这里讨论的那些分析策略所特有的问题。然而,由于我们强调的许多原因,像前面描述的那些灵敏度检查是分析过程的一个关键组成部分。最后,必须指出,该领域尚未取得进展,以便为应用研究人员提供强有力的指导和统计软件,使他们能够在主体分层框架内广泛利用基于模型的估计战略。在我们自己的工作中,我们试图提供可用的教程和代码,使得复制我们自己的分析成为可能(例如,Feller 等,2014) ,但是认识到更广泛的采用将需要开发分析例程和用户友好的软件包。然而,对于有兴趣进一步了解主要分层的读者,我们推荐 Imbens 和 Rubin (2015) ,Mealli 和 Mattei (2012)以及 Schochet,Puma 和 Deke (2014)提供的概述作为下一组参考进行调查。
    
==另见==
 
==另见==
316

个编辑