更改

删除986字节 、 2022年8月15日 (一) 21:58
第165行: 第165行:  
基于主要分层的分析分为三个阶段。第一阶段是确定我们前面描述的主要层次。总的来说,这个过程涉及到以一种相对高层次的方式思考实质性问题。下一阶段是将这些层次正式化,并编码进一步的实质性信息,以便日后进行估计。我们将在本节中讨论前两个阶段。最后一个阶段是估算,在第四部分中讨论。
 
基于主要分层的分析分为三个阶段。第一阶段是确定我们前面描述的主要层次。总的来说,这个过程涉及到以一种相对高层次的方式思考实质性问题。下一阶段是将这些层次正式化,并编码进一步的实质性信息,以便日后进行估计。我们将在本节中讨论前两个阶段。最后一个阶段是估算,在第四部分中讨论。
   −
首先,为了更好地界定地层,我们需要对随机试验的工作方式做一些假设。主要分层是基于潜在结果框架(Frangakis & Rubin,2002; Neyman,1923; Rubin,2005) ,它有效地考虑了每个研究个体具有个体的潜在结果和相关的潜在治疗效果。人 i,Yi (1)和 Yi (0)的潜在结果是我们可能看到的结果,如果我们治疗或不治疗的人,分别。
+
首先,为了更好地界定层组,我们需要对随机试验的工作方式做一些假设。主要分层是基于潜在结果框架 ,它有效地考虑了每个研究个体具有个体的潜在结果和相关的潜在治疗效果。Yi (1)和 Yi (0)是如果进行治疗或不治疗的人的潜在结果。
    
鉴于这些数值,一个关键的感兴趣的数量,整体平均治疗效果,是这些个别治疗效果的平均值。
 
鉴于这些数值,一个关键的感兴趣的数量,整体平均治疗效果,是这些个别治疗效果的平均值。
第171行: 第171行:  
因果影响是明确的,不依赖于任何分布或抽样假设: 人口由个人在实验中,而不是更多。挑战在于,虽然所有的潜在结果都已确定,但根据随机治疗分配,对于每个人来说,实际上只观察到一个潜在结果。
 
因果影响是明确的,不依赖于任何分布或抽样假设: 人口由个人在实验中,而不是更多。挑战在于,虽然所有的潜在结果都已确定,但根据随机治疗分配,对于每个人来说,实际上只观察到一个潜在结果。
   −
为了从这些基本定义出发,我们首先做出两个普遍接受的假设。首先,治疗实际上是随机的,我们将其表述为一个独立的假设,在个体是否接受治疗和个体的潜在结果是什么之间。第二个,通常被称为稳定单位治疗价值假设(SUTVA)(Rubin,1978,1980,1990) ,有效地说明治疗一个人不会影响另一个人(即,治疗一个学生没有溢出效应,不会帮助其他学生)。对于那些不熟悉潜在结果框架,我们建议 Angrist 等人的研究(1996年) ,其中讨论了这种情况下的不遵守。进一步的讨论,见 Imbens 和 Rubin (2015)或 Rosenbaum 的前三分之一(2010)。
+
=== 基础假设 ===
 +
为了从这些基本定义出发,我们首先做出两个普遍接受的假设。首先,治疗实际上是随机的,我们将其表述为一个独立的假设,即在个体是否接受治疗和个体的潜在结果之间是相互独立的。第二个,通常被称为稳定单位治疗价值假设(SUTVA)(Rubin,1978,1980,1990) ,有效地说明治疗一个人不会影响另一个人(即,治疗一个学生没有溢出效应,不会帮助其他学生)。
   −
上述假设为我们提供了明确的地层和明确的治理效果在每一个层。推理如下: 给定 SUTVA,个体对任何一种实验条件的反应本质上是个体的特征。这反过来又意味着,每个个体的成员阶层在本质上是个体的特征。鉴于治疗分配是随机的,它与阶层成员无关。因此,阶层内治疗效果是因果效应,就像其他亚组治疗效果一样。随着地层和地层水平处理效应的确定,我们进入下一阶段,我们增加了实质性的假设,对地层施加约束。这些限制非常重要,因为如果没有这些限制,通常很难在估计关键的利息数量方面取得进展。更重要的是,假设使我们能够正式地将我们对问题的实质性知识纳入我们的分析。这是主要分层框架的一个特别好处。在讨论前面提到的主体分层的其他设置之前,我们简要讨论了在标准不遵从性、单调性和排除限制的背景下最常见的两个假设
+
上述假设为我们提供了明确的地层和明确的治理效果在每一个层。推理如下: 给定 SUTVA,个体对任何一种实验条件的反应本质上是个体的特征。这反过来又意味着,每个个体的成员阶层在本质上是个体的特征。鉴于治疗分配是随机的,它与阶层成员无关。因此,阶层内治疗效果是因果效应,就像其他亚组治疗效果一样。随着地层和地层水平处理效应的确定,我们进入下一阶段,我们增加了实质性的假设,对地层施加约束。这些限制非常重要,因为如果没有这些限制,通常很难在估计关键的利息数量方面取得进展。
   −
=== 二元不遵从语境中的单调性和排除限制 ===
+
更重要的是,假设使我们能够正式地将我们对问题的实质性知识纳入我们的分析。这是主要分层框架的一个特别好处。在讨论前面提到的主体分层的其他设置之前,我们简要讨论了在标准不遵从性、单调性和排除限制的背景下最常见的两个假设
人们实际上如何回应随机提出采取给定的干预措施。单调性是这样一种假设,即一个人至少有可能接受分配给治疗条件的治疗,就像分配给控制条件的治疗一样。回到图1,其中显示了在纽约市学校教育券实验的背景下为二元不遵守建立的主要分层,单调性假设排除了任何“违背者”的可能性,因为这个阶层的儿童会在没有教育券提供但没有教育券提供的情况下进入私立学校。
      +
=== 二元不遵从语境中的单调性和排除限制假设 ===
 +
人们实际上如何回应随机提出采取给定的干预措施。
   −
第二个主要假设是排除限制,它涉及到分配到治疗条件将如何影响那些实际上不接受治疗的个人,如果提供的话。同样,在图1所示的例子的上下文中,这些孩子的学校类型将被随机优惠券提供保持不变。总是接受教育的学生总是进入私立学校,有或没有教育券,而从不接受教育的学生总是进入公立学校。鉴于随机化不会改变这些亚组儿童的学校教育类型,我们假设随机化同样不会影响这些儿童的后续结果。同样地,我们假设,在这些地层中,治疗的效果为零
+
==== 单调性假设 ====
 +
单调性是这样一种假设,即一个人至少有可能接受分配给治疗条件的治疗,就像分配给控制条件的治疗一样。回到图1,其中显示了在纽约市学校教育券实验的背景下为二元不遵守建立的主要分层,单调性假设排除了任何“违背者”的可能性,因为这个阶层的儿童会在没有教育券提供的情况下进入私立学校。
 +
 
 +
==== [[文件:主分层案例1.png]] 排除限制假设 ====
 +
第二个主要假设是排除限制,它涉及到分配到治疗条件将如何影响那些实际上不接受治疗的个人,如果提供的话。同样,在图1所示的例子的上下文中,这些孩子的学校类型将被随机优惠券提供保持不变。总是接受教育的学生总是进入私立学校,有或没有教育券,而从不接受教育的学生总是进入公立学校。鉴于随机化不会改变这些亚组儿童的学校教育类型,我们假设随机化同样不会影响这些儿童的后续结果。同样地,我们假设,在这些层组中,治疗的效果为零
      第185行: 第191行:     
== 估计随机试验中的关键主要因果效应 ==
 
== 估计随机试验中的关键主要因果效应 ==
正如上述讨论所表明的,主层的定义和实质性的假设,以限制这些地层的特点是没有参考或事先估计。在我们看来,这种分离是利用主要分层框架的一个有益的方面: 第一个表达兴趣的组和数量,第二个确定可能有助于进一步限制或通知这些数量的实质性知识(例如假设) ,然后才能评估估计是否可能以及如何可能。简而言之,估算过程是独立的,有别于阐明这些数量的估算过程。根据对问题施加的约束,可以采取不同的一般策略进行估计。这些策略可以分为基于矩的方法(非参数)和基于模型的方法。首先,我们纯粹依赖于我们最初的假设来表达目标数量(例如地层特定的平均处理效应)作为数据的直接可观察特征的函数。当这不可能实现时,可以削弱基于矩的方法,转而试图约束目标数量。第二种方法是直接对部分或全部数据建模。这通常需要对主要阶层的结果做出分布假设,并利用基线协变量来预测个人的阶层成员。
+
估算随机实验的主要因果效应的策略可以分为基于矩的方法(非参数)和基于模型的方法。
 +
 
 +
首先,我们纯粹依赖于我们最初的假设来表达目标数量(例如层组的特定的平均处理效应)作为数据的直接可观察特征的函数。当这不可能实现时,可以削弱基于矩的方法,转而试图约束目标数量。第二种方法是直接对部分或全部数据建模。这通常需要对主要阶层的结果做出分布假设,并利用基线协变量来预测个人层组的成员。
 +
 
 +
我们把第一种方法称为“基于矩”,因为我们可以根据可估计的“矩”或数量(如平均值和比例)来估计相关的特定层次的治疗效果。第二种方法是“基于模型的”,因为我们的评估过程涉及从连接模型估计参数。
 +
 
 +
这两种方法之间的关键区别在于,基于矩的方法只使用样本级信息,而基于模型的方法使用个体级信息,正如我们下面所讨论的。
 +
 
 +
在不遵从的情况下,第一种策略可能对应用的定量研究者更为熟悉,而与第二种策略相关的工具和程序对于在更复杂的主体分层应用中估计主要因果效应通常是必要的。
   −
我们把第一种方法称为“基于时刻”,因为我们可以根据可估计的“时刻”或数量(如平均值和比例)来估计相关的特定层次的治疗效果。第二种方法是“基于模型的”,因为我们的评估过程涉及
+
基于矩的非参数方法依赖于较弱的假设,并允许考虑的结果的非标准和未知的分布形式。然而,这种结构的缺乏使得解开许多层组变得更加困难。
   −
从铰接模型估计参数(Imbens & Rubin,1997)。这两种方法之间的关键区别在于,基于矩的方法只使用样本级信息,而基于模型的方法使用个体级信息,正如我们下面所讨论的。在不遵从的情况下,第一种策略可能对应用的定量研究者更为熟悉,而与第二种策略相关的工具和程序对于在更复杂的主体分层应用中估计主要因果效应通常是必要的。关于比较这两种方法的教科书讨论,参见 Imbens 和 Rubin (2015)。还可以看到 Stuart,Perry,Le 和 Ialongo (2008)的介绍。这两种通用的方法有不同的优点和缺点。基于矩的非参数方法依赖于较弱的假设,并允许考虑的结果的非标准和未知的分布形式。然而,这种结构的缺乏使得解开许多地层变得更加困难。至少在原则上,基于模型的方法可以分离出多层,以便洞察治疗影响的复杂模式。然而,重要的是,基本的分析工作是分离混合物之一ーー这是一个出了名的困难问题ーー而且这样做可能有些微妙,因为治疗效果的估计可能对建模选择敏感
+
至少在原则上,基于模型的方法可以分离出多层,以便洞察治疗影响的复杂模式。然而,重要的是,基本的分析工作是分离混合物之一ーー这是一个出了名的困难问题ーー而且这样做可能有些微妙,因为治疗效果的估计可能对建模选择敏感。
    
== 主分层框架的好处和局限性 ==
 
== 主分层框架的好处和局限性 ==
316

个编辑