第4行: |
第4行: |
| }} | | }} |
| | | |
| + | == 研究动机 == |
| + | 社会科学研究的一个真理,一切都是变化的。虽然我们不能期望了解影响变化的所有因素,但我们经常可以了解在特定的亚种发生的变化。例如,我们可能会根据某些可观察到的个体特征(如性别、种族/民族或社会经济地位)来估计干预的效果是如何变化的。 |
| + | |
| + | 在随机对照试验(RCT)的背景下,估计这些亚组处理效果通常是一个直接的分析练习,通常通过估计亚组特征定义的子样本内的处理-对照差异,或通过在线性模型中包括处理和亚组指标之间的交互项来完成。 |
| + | |
| + | 这些方法给出了每个亚组的估计治疗效果,并通过似然比检验等测试程序确定亚组效应是否存在显著差异。本质上,这些方法将感兴趣的分组视为小型实验,并返回每个此类实验的处理影响的估计。 |
| + | |
| + | 然而,越来越多的研究人员对部分观察到的甚至完全潜在的亚组的治疗效果变化感兴趣,这些亚组不是由标准的预处理特征(如性别或种族/民族)定义的,而是由随机化后的行为、行动或决定定义的。 |
| + | |
| + | 例如 |
| + | |
| + | 1.私立学校提供代金券对那些只在获得代金券后才会就读私立学校的孩子,而在其他情况下会就读公立学校的孩子有什么影响? |
| + | |
| + | 2. 对于那些无论是否有机会参加该计划都无法完成高中学业的学生来说,多层面预防辍学计划的影响是什么? 相比之下,该项目是否只改善了那些因有机会参加该项目而从高中毕业的学生的成绩? |
| + | |
| + | 3.对于那些有机会参加但没有机会接受家庭护理的儿童来说,参加幼儿计划会有什么影响?这与那些本可以参加其他中心护理的儿童的影响相比如何? |
| + | |
| + | |
| + | 与标准的子组分析相比,在这些例子中,我们无法观察到相关子组中的个体成员,从而阻止了经典的子组方法。两个关键特征是值得强调的亚组的研究兴趣是由这些研究问题确定的。 |
| + | |
| + | 首先,子组是由特定的随机化后行为定义的。其次,为了将研究参与者分成这些兴趣的亚组,我们需要能够在观察到的和未观察到的(即反事实)实验条件下观察个体水平的行为。 |
| + | |
| + | 在前面提到的第一个问题中,我们感兴趣的是那些在对照条件下将被分配到公立学校,但在收到随机分配的代金券后将被分配到私立学校的孩子 |
| + | |
| + | 在第二种情况下,我们感兴趣的是那些无论他们被分配到何种实验条件下都无法从高中毕业的学生。 |
| + | |
| + | 第三,我们感兴趣的是那些接受早期儿童项目的孩子,如果这些孩子被分配到控制条件下,按照他们将经历的护理环境进行分组。 |
| + | |
| + | 所有这些类型的问题都允许我们进一步解读整体的治疗意图(ITT)效应,以了解特定的干预措施对儿童和家庭的影响。答案可以帮助确定所观察到的ITT效应是否由一个特定的潜在亚组驱动,如果是,如何调整干预以更好地服务于所有预期参与者。 |
| + | |
| + | 当然,在现实中,我们只能观察研究参与者在分配治疗或控制下的随机化后行为——但不能同时观察两者。'''处理这类研究问题的一个分析框架是主要分层'''(Frangakis & Rubin, 2002)。主要分层背后的思想是首先根据样本成员在随机化后的选择、行动或经验定义内生(或与规划相关)子组,简称为'''主分层'''。 |
| + | |
| + | 在统计学上,'''“主要分层”一词源于医学试验中的并发症,并最终由Frangakis和Rubin(2002)正式确定'''。该框架的一个特殊贡献是,它提供了清晰的区分过程,确定治疗效果的兴趣,从分析策略用于估计这些数量,我们将在下面进一步说明。 |
| + | |
| + | == 概念定义 == |
| '''主分层 Principal stratification'''是指按照某处理后变量的潜在结果对总体分层,然后考察某一层内的因果作用,例如含有非依从性的试验中的依从者,含有死亡截断的试验中的永远幸存者'''。它'''是一种应用于因果推断的统计技术,它根据处置后协变量来调整因果效应。其基本思想是识别潜在的分层结构,然后只计算每一层的因果效应。这就是所谓的'''局部平均处理效应 local average treatment effect(LATE)'''。 | | '''主分层 Principal stratification'''是指按照某处理后变量的潜在结果对总体分层,然后考察某一层内的因果作用,例如含有非依从性的试验中的依从者,含有死亡截断的试验中的永远幸存者'''。它'''是一种应用于因果推断的统计技术,它根据处置后协变量来调整因果效应。其基本思想是识别潜在的分层结构,然后只计算每一层的因果效应。这就是所谓的'''局部平均处理效应 local average treatment effect(LATE)'''。 |
| | | |
| 在从在非依从现象时,我们能够识别的只是依从者——也就是人群中的某一“层”的平均因果作用。Frangakis和Rubin把这一观察总结为主分层(principal stratification)的概念,即按照某种处理后的潜在结果对总体进行分层,而真正关心的因果作用被局限在某一个主层内。 | | 在从在非依从现象时,我们能够识别的只是依从者——也就是人群中的某一“层”的平均因果作用。Frangakis和Rubin把这一观察总结为主分层(principal stratification)的概念,即按照某种处理后的潜在结果对总体进行分层,而真正关心的因果作用被局限在某一个主层内。 |
| + | |
| + | 本文旨在作为主要分层的非技术入门。 |
| + | |
| + | 在第二部分中,我们强调主要分层框架的几种不同应用,以说明它可以应用的实质性问题和方法问题的广度。 |
| + | |
| + | 在第三部分中,我们将重点放在识别和估计地层特定处理效果的关键假设上。 |
| + | |
| + | 在第四部分中,我们提出了两种不同的方法来估计随机试验中存在简单(即二元)不符合的关键主要因果效应。并强调某些估计程序如何可以扩展,以处理更复杂的应用的主要分层框架。 |
| + | |
| + | 最后,我们将重点介绍主要分层框架的好处和局限性,以及该领域的分析工具的现状,这些分析工具将对应用定量研究人员产生兴趣和价值。 |
| + | |
| + | 在整个过程中,我们强调了这种分析的反事实逻辑基础,以及支撑这种方法并使分析挑战更易于处理的假设。 |
| + | |
| ==示例1== | | ==示例1== |
| 主分层的一个例子是随机对照试验的退出偏移问题。使用处置后的二元协变量(例如:退出)和二元处置变量(例如:“处置”和“对照”) ,受试者可能有四种情形: | | 主分层的一个例子是随机对照试验的退出偏移问题。使用处置后的二元协变量(例如:退出)和二元处置变量(例如:“处置”和“对照”) ,受试者可能有四种情形: |
第48行: |
第96行: |
| | | |
| 仅仅通过观察数据无法判断出一个个体属于哪个主层,所以需要为所定义的因果量找到合理的解释才有实际意义。值得一提的是,死亡截断的问题在其他领域中也会遇到。比如要研究给学生奖学金能否会提高学生成绩,学生成绩只有在其不辍学时才能定义;要研究疫苗对于病毒载量的影响,病毒载量只有当一个人感染了才能定义。 | | 仅仅通过观察数据无法判断出一个个体属于哪个主层,所以需要为所定义的因果量找到合理的解释才有实际意义。值得一提的是,死亡截断的问题在其他领域中也会遇到。比如要研究给学生奖学金能否会提高学生成绩,学生成绩只有在其不辍学时才能定义;要研究疫苗对于病毒载量的影响,病毒载量只有当一个人感染了才能定义。 |
| + | |
| + | == 主分层的应用 == |
| + | |
| + | == 主分层的关键假设 == |
| + | |
| + | == 估计随机试验中的关键主要因果效应 == |
| + | |
| + | == 主分层框架的好处和局限性 == |
| | | |
| ==另见== | | ==另见== |