“鲁宾因果模型”的版本间的差异

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索
(Moved page from wikipedia:en:Rubin causal model (history))
 
第1行: 第1行:
此词条暂由彩云小译翻译,翻译字数共430,未经人工整理和审校,带来阅读不便,请见谅。
+
鲁宾因果模型 (RCM),也称为 Neyman-Rubin 因果模型,<ref name="sekhon">{{cite book |last=Sekhon |first=Jasjeet |chapter=The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods |title=The Oxford Handbook of Political Methodology |year=2007 |chapter-url=http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf }}</ref>是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 <ref name="holland:causal86">{{cite journal |last=Holland |first=Paul W. |title=Statistics and Causal Inference |journal=[[Journal of the American Statistical Association|J. Amer. Statist. Assoc.]] |volume=81 |issue=396 |year=1986 |pages=945–960 |jstor=2289064 |doi=10.1080/01621459.1986.10478354}}</ref>潜在结果框架最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,<ref name="neyman:masters">Neyman, Jerzy. ''Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes.'' Master's Thesis (1923).  Excerpts reprinted in English, Statistical Science, Vol. 5, pp.&nbsp;463–472. ([[Dorota Dabrowska|D. M. Dabrowska]], and T. P. Speed, Translators.)</ref>尽管他只在完全随机实验的背景下讨论了它。 <ref name="Jasa1">{{cite journal |last=Rubin |first=Donald |year=2005 |title=Causal Inference Using Potential Outcomes |journal=[[Journal of the American Statistical Association|J. Amer. Statist. Assoc.]] |volume=100 |issue=469 |pages=322–331 |doi=10.1198/016214504000001880 }}</ref>鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。<ref name="sekhon"/>
  
{{short description|Method of statistical analysis}}
+
==介绍==
  
{{Format footnotes|date=February 2021}}
+
鲁宾因果模型基于潜在结果的想法。例如,如果一个人上过大学,他在 40 岁时会有特定的收入,而如果他没有上过大学,他在 40 岁时会有不同的收入。为了衡量这个人上大学的因果效应,我们需要比较同一个人在两种不同的未来中的结果。由于不可能同时看到两种潜在结果,因此总是缺少其中一种潜在结果。这种困境就是“因果推理的基本问题”。
  
The '''Rubin causal model''' ('''RCM'''), also known as the '''Neyman–Rubin causal model''',<ref name="sekhon">{{cite book |last=Sekhon |first=Jasjeet |chapter=The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods |title=The Oxford Handbook of Political Methodology |year=2007 |chapter-url=http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf }}</ref> is an approach to the [[statistical analysis]] of [[Causality|cause and effect]] based on the [[Conceptual framework|framework]] of [[counterfactual conditional|potential outcomes]], named after [[Donald Rubin]]. The name "Rubin causal model" was first coined by [[Paul W. Holland]].<ref name="holland:causal86">{{cite journal |last=Holland |first=Paul W. |title=Statistics and Causal Inference |journal=[[Journal of the American Statistical Association|J. Amer. Statist. Assoc.]] |volume=81 |issue=396 |year=1986 |pages=945–960 |jstor=2289064 |doi=10.1080/01621459.1986.10478354}}</ref> The potential outcomes framework was first proposed by [[Jerzy Neyman]] in his 1923 Master's thesis,<ref name="neyman:masters">Neyman, Jerzy. ''Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes.'' Master's Thesis (1923).  Excerpts reprinted in English, Statistical Science, Vol. 5, pp.&nbsp;463–472. ([[Dorota Dabrowska|D. M. Dabrowska]], and T. P. Speed, Translators.)</ref> though he discussed it only in the context of completely randomized experiments.<ref name="Jasa1">{{cite journal |last=Rubin |first=Donald |year=2005 |title=Causal Inference Using Potential Outcomes |journal=[[Journal of the American Statistical Association|J. Amer. Statist. Assoc.]] |volume=100 |issue=469 |pages=322–331 |doi=10.1198/016214504000001880 }}</ref> Rubin extended it into a general framework for thinking about causation in both observational and experimental studies.<ref name="sekhon"/>
+
由于因果推理的根本问题,无法直接观察到单元级别的因果效应。然而,随机实验允许估计人口水平的因果效应。<ref name=":01">{{cite journal |last=Rubin |first=Donald |title=Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies |journal=[[Journal of Educational Psychology|J. Educ. Psychol.]] |volume=66 |issue=5 |year=1974 |pages=688–701 [p. 689] |doi=10.1037/h0037350 }}</ref>随机实验将人们随机分配到对照组:大学或非大学。由于这种随机分配,各组(平均)相等,40 岁时的收入差异可归因于大学分配,因为这是各组之间的唯一差异。然后可以通过计算处理(上大学)和对照(非上大学)样本之间的平均值差异来获得平均因果效应(也称为平均处理效应)的估计值。
  
The Rubin causal model (RCM), also known as the Neyman–Rubin causal model, is an approach to the statistical analysis of cause and effect based on the framework of potential outcomes, named after Donald Rubin. The name "Rubin causal model" was first coined by Paul W. Holland. The potential outcomes framework was first proposed by Jerzy Neyman in his 1923 Master's thesis, though he discussed it only in the context of completely randomized experiments.  Rubin extended it into a general framework for thinking about causation in both observational and experimental studies. A randomized experiment assigns people randomly to treatments: college or no college. Because of this random assignment, the groups are (on average) equivalent, and the difference in income at age 40 can be attributed to the college assignment since that was the only difference between the groups. An estimate of the average causal effect (also referred to as the average treatment effect) can then be obtained by computing the difference in means between the treated (college-attending) and control (not-college-attending) samples.
+
然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
  
虚拟事实模型分析法,也称为 Neyman-虚拟事实模型分析法,是一种基于潜在结果框架的因果统计分析方法,以 Donald Rubin 的名字命名。虚拟事实模型的名字是由 Paul w. Holland 首创的。潜在结果框架最早是由 Jerzy Neyman 在他1923年的硕士论文中提出的,尽管他只是在完全随机化实验的背景下讨论它。鲁宾把它扩展到一个普遍的框架,用来思考观察和实验研究中的因果关系。一个随机实验随机分配人参加治疗: 上大学或不上大学。由于这种随机分配,这些群体(平均)是相等的,40岁时的收入差异可以归因于大学分配,因为这是这些群体之间唯一的差异。平均因果效应(也称为平均治疗效应)的估计可以通过计算治疗(就读大学)和对照(非就读大学)样本之间的平均值差异来获得。
+
==一个扩展案例==
  
 +
鲁宾定义了一个因果效应:
  
 +
<blockquote>
 +
直观地说,一种处理 E 对另一种处理 C 的因果效应对于特定单位和从 <math>t_{1}</math> 至 <math>t_{2}</math> 是当时会发生的事情之间的差异 <math>t_{2}</math> 如果装置暴露于 E 开始于 <math>t_{1}</math> 以及会发生什么 <math>t_{2}</math> 如果该装置已暴露于 C 开始于<math>t_{1}</math>:“如果一个小时前我服用了两个阿司匹林而不是一杯水,我的头痛现在就会消失”,或者“因为一个小时前我服用了两个阿司匹林而不是一杯水,我的头痛现在消失了.' 我们对 E 与 C 处理的因果效应的定义将反映这种直观的含义。<ref name=":01"/>”
 +
</blockquote>
 +
 +
根据 RCM,您在一小时前服用或不服用阿司匹林的因果效应是您的头部在情况 1(服用阿司匹林)和情况 2(未服用阿司匹林)中的感受的差异。如果没有阿司匹林你的头痛仍然存在,但如果服用阿司匹林头痛就会消失,那么服用阿司匹林的因果效应是头痛缓解。在大多数情况下,我们对比较两种特性感兴趣,一种通常称为“处理”,另一种称为“控制”。这些标签有些随意。
 +
 +
===潜在结果===
 +
 +
假设 Joe 正在参加 FDA 对一种新的高血压药物的测试。如果我们无所不知,我们就会知道乔在处理(新药)和控制(未处理或当前标准处理)下的结果。因果效应或处理效应是这两种潜在结果之间的差异。
 +
 +
{| class="wikitable" align="center"
 +
 +
!主题!!<math>Y_{t}(u)</math>!!<math>Y_{c}(u)</math>!!<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||135||−5
  
==Introduction==
+
|}
  
In many circumstances, however, randomized experiments are not possible due to ethical or practical concerns. In such scenarios there is a non-random assignment mechanism. This is the case for the example of college attendance: people are not randomly assigned to attend college. Rather, people may choose to attend college based on their financial situation, parents' education, and so on. Many statistical methods have been developed for causal inference, such as propensity score matching.  These methods attempt to correct for the assignment mechanism by finding control units similar to treatment units.
+
如果乔服用新药丸,<math>Y_{t}(u)</math>就是他的血压。通常,该符号表示对单位u进行处理t 所产生的潜在结果。类似的,<math>Y_{c}(u)</math>是不同处理t或控制c对单元u的影响。在这种情况下,如果乔不服药,<math>Y_{c}(u)</math>就是他的血压。<math>Y_{t}(u)-Y_{c}(u)</math> 是服用新药的因果效应。
  
然而,在许多情况下,由于伦理或实际的考虑,随机试验是不可能的。在这种情况下,有一个非随机分配机制。这就是大学出勤率的例子: 人们并不是随机分配到大学的。相反,人们可能会根据自己的经济状况、父母的教育程度等因素选择上大学。许多因果推断的统计方法已经被开发出来,比如倾向评分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
+
从这张表中我们只知道对 Joe 的因果效应。研究中的其他人如果服用避孕药,血压可能会升高。然而,不管对其他受试者的因果效应是什么,乔的因果效应是血压降低(相对于他没有服用避孕药时的血压)。
  
 +
考虑更大的患者样本:
  
 +
{| class="wikitable" align="center"
  
The Rubin causal model is based on the idea of potential outcomes. For example, a person would have a particular income at age 40 if he had attended college, whereas he would have a different income at age 40 if he had not attended college.  To measure the causal effect of going to college for this person, we need to compare the outcome for the same individual in both alternative futures. Since it is impossible to see both potential outcomes at once, one of the potential outcomes is always missing. This dilemma is the "fundamental problem of [[causal inference]]".
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||135||−5
 +
|-
 +
!玛丽||140||150||−10
 +
|-
 +
!莎莉||135||125||10
 +
|-
 +
!鲍勃||135||150||−15
  
 +
|}
  
 +
因果效应对于每一个主题是不同的,但药物对乔,玛丽和鲍勃都有影响,因为因果效应是负的。他们服用药物后的血压低于每个人不服用药物时的血压。另一方面,对于 Sally 来说,这种药物会导致血压升高。
  
Because of the fundamental problem of causal inference, unit-level causal effects cannot be directly observed. However, randomized experiments allow for the estimation of population-level causal effects.<ref name=":01">{{cite journal |last=Rubin |first=Donald |title=Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies |journal=[[Journal of Educational Psychology|J. Educ. Psychol.]] |volume=66 |issue=5 |year=1974 |pages=688–701 [p. 689] |doi=10.1037/h0037350 }}</ref> A randomized experiment assigns people randomly to treatments: college or no college. Because of this random assignment, the groups are (on average) equivalent, and the difference in income at age 40 can be attributed to the college assignment since that was the only difference between the groups. An estimate of the '''average causal effect''' (also referred to as the '''[[average treatment effect]]''') can then be obtained by computing the difference in means between the treated (college-attending) and control (not-college-attending) samples.
+
为了使潜在结果有意义,它必须是可能的,至少是先验的。例如,如果乔在任何情况下都无法获得新药,那么<math>Y_{t}(u)</math>对他来说是不可能的。它永远不会发生。而如果<math>Y_{t}(u)</math>永远无法观察到(即使在理论上),那么对乔的血压的因果效应是不确定的。
  
Rubin defines a causal effect:
+
===没有操纵就没有因果关系===
  
鲁宾定义了一种因果效应:
+
新药的因果效应是明确定义的,因为它是两种可能发生的潜在结果的简单差异。在这种情况下,我们(或其他事物)可以干预世界,至少在概念上是这样,因此可能会发生不同的事。
  
 +
如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加成问题。例如,乔的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:Joe 在处理下的体重(处理被定义为高3英寸)和 Joe 在控制下的体重(控制被定义为他当前的身高)。
  
 +
问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。
  
In many circumstances, however, randomized experiments are not possible due to ethical or practical concerns. In such scenarios there is a non-random assignment mechanism. This is the case for the example of college attendance: people are not randomly assigned to attend college. Rather, people may choose to attend college based on their financial situation, parents' education, and so on. Many statistical methods have been developed for causal inference, such as [[propensity score matching]].  These methods attempt to correct for the assignment mechanism by finding control units similar to treatment units.
+
===稳定单元处理值假设 (SUTVA)===
  
<blockquote>
+
我们要求“对一个单元的 [潜在结果] 观察不应受到其他单元的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为稳定单元处理值假设(SUTVA),它超越了独立性的概念。
  
< 封锁报价 >
+
在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,他的结果将取决于他接受的处理和玛丽接受的处理。
  
 +
SUTVA 违规使因果推断更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。
  
  
Intuitively, the causal effect of one treatment, E, over another, C, for a particular unit and an interval of time from <math>t_1</math> to <math>t_2</math> is the difference between what would have happened at time <math>t_2</math> if the unit had been exposed to E initiated at <math>t_1</math> and what would have happened at <math>t_2</math> if the unit had been exposed to C initiated at <math>t_1</math>: 'If an hour ago I had taken two aspirins instead of just a glass of water, my headache would now be gone,' or 'because an hour ago I took two aspirins instead of just a glass of water, my headache is now gone.'  Our definition of the causal effect of the E versus C treatment will reflect this intuitive meaning." and other techniques for causal inference. For more on the connections between the Rubin causal model, structural equation modeling, and other statistical methods for causal inference, see Morgan and Winship (2007).
+
{| class="wikitable" align="center"
 +
!主题||乔 = c,玛丽 = t||乔 = t,玛丽 = t||乔 = c,玛丽 = c||乔 = t,玛丽 = c
 +
|-
 +
!乔||140||130||125||120
 +
|}
  
直观上,一种治疗方法 e 对另一种治疗方法 c 的因果关系,对于一个特定的单位和一段时间间隔,如果这个单位在 < math > t _ 1 </math > < math > t _ 2 </math > 之间暴露于 e,那么在 < math > t _ 1 </math > 之前会发生什么,如果这个单位在 < math > t _ 1 </math > 之前暴露于 c,那么在 < math > t _ 2 </math > 之前会发生什么,如果一个小时之前我吃了两片阿司匹林而不是一杯水,我的头痛现在就会消失,或者因为一小时前我吃了两片阿司匹林而不是一杯水,现在我的头痛好了我们对 e 与 c 治疗的因果关系的定义将反映这一直观意义。”以及其他因果推理技术。要了解更多关于虚拟事实模型、结构方程模型和其他因果推断统计方法之间的联系,请参见 Morgan 和 Winship (2007)。
+
回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是玛丽接受处理时药物对乔的因果效应<math>130-140</math>。另一个是当玛丽没有接受处理时对乔的因果效应<math>120-125</math>。第三是在乔没有得到处理的情况下,玛丽的处理对乔的因果效应<math>140-125</math>。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。
  
==An extended example==
+
通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何单位都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖单位的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。
  
 +
===平均因果效应===
  
 +
考虑:
  
Rubin defines a causal effect:
+
{| class="wikitable" align="center"
 +
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||135||−5
 +
|-
 +
!玛丽||130||145||−15
 +
|-
 +
!莎莉||130||145||−15
 +
|-
 +
!鲍勃||140||150||−10
 +
|-
 +
!詹姆士||145||140||+5
 +
|-
 +
!吝啬的||135||143||−8
 +
|}
  
 +
人们可以通过取所有因果效应的平均值来计算平均因果效应。
  
 +
我们如何测量反馈效应会影响我们得出的推论。假设我们以百分比变化而不是绝对值来测量血压的变化。然后,根据确切的数字,平均因果效应可能是血压升高。例如,假设乔治的血压在控制下为 154,在处理后为 140。因果效应的绝对大小为 -14,但百分比差异(就 140 的处理水平而言)为 -10%。如果莎拉的血压在治疗下为 200,在控制下为 184,那么因果效应的绝对值是 16,而治疗值是 8%。乔治的血压绝对变化较小(-14 对 16)会产生较大的百分比变化(-10% 对 8%)。
  
<blockquote>
+
===因果推理的基本问题===
 +
 
 +
到目前为止,我们所看到的结果永远无法在实践中衡量。根据定义,不可能在特定时间段内观察多种处理对受试者的影响。乔不能同时服用避孕药和不服用避孕药。因此,数据看起来像这样:
 +
 
 +
{| class="wikitable" align="center"
 +
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||?||?
 +
|}
 +
 
 +
问号是无法观察到的反馈。因果推断的基本问题<ref name="holland:causal86"/>是不可能直接观察因果效应。然而,这并不使因果推断成为不可能。某些技术和假设可以克服基本问题。
  
Intuitively, the causal effect of one treatment, E, over another, C, for a particular unit and an interval of time from <math>t_1</math> to <math>t_2</math> is the difference between what would have happened at time <math>t_2</math> if the unit had been exposed to E initiated at <math>t_1</math> and what would have happened at <math>t_2</math> if the unit had been exposed to C initiated at <math>t_1</math>: 'If an hour ago I had taken two aspirins instead of just a glass of water, my headache would now be gone,' or 'because an hour ago I took two aspirins instead of just a glass of water, my headache is now gone.'  Our definition of the causal effect of the E versus C treatment will reflect this intuitive meaning."<ref name=":01"/>
+
假设我们有以下数据:
  
</blockquote>
+
{| class="wikitable" align="center"
 +
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||?||?
 +
|-
 +
!玛丽||?||125||?
 +
|-
 +
!莎莉||100||?||?
 +
|-
 +
!鲍勃||?||130||?
 +
|-
 +
!詹姆士||?||120||?
 +
|-
 +
!吝啬的||115||125||−10
 +
|}
  
 +
如果我们假设效应恒定,我们可以推断出乔在控制下的潜在结果是什么:
  
 +
<math>Y_{t}(u)=T+Y_{c}(u)</math>
 +
 +
<math>Y_{t}(u)-T=Y_{c}(u)</math>。
  
According to the RCM, the causal effect of your taking or not taking aspirin one hour ago is the difference between how your head would have felt in case 1 (taking the aspirin) and case 2 (not taking the aspirin).  If your headache would remain without aspirin but disappear if you took aspirin, then the causal effect of taking aspirin is headache relief. In most circumstances, we are interested in comparing two futures, one generally termed "treatment" and the other "control". These labels are somewhat arbitrary.
+
如果我们想推断未观察到的值,我们可以假设一个恒定的影响。下表说明了与恒定效应假设一致的数据。
  
 +
{| class="wikitable" align="center"
 +
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||140||−10
 +
|-
 +
!玛丽||115||125||−10
 +
|-
 +
!莎莉||100||110||−10
 +
|-
 +
!鲍勃||120||130||−10
 +
|-
 +
!詹姆士||110||120||−10
 +
|-
 +
!吝啬的||115||125||−10
 +
|}
 +
 +
所有受试者即使在治疗下有不同的结果,也具有相同的因果效应。
  
 +
===分配机制===
  
===Potential outcomes===
+
分配机制,即分配单位处理的方法,影响平均因果效应的计算。一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。如果我们希望五个受试者接受处理,我们可以将处理分配给我们从帽子里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。
  
 +
假设这个数据是真实的:
  
 +
{| class="wikitable" align="center"
  
Suppose that Joe is participating in an FDA test for a new hypertension drug.  If we were omniscient, we would know the outcomes for Joe under both treatment (the new drug) and control (either no treatment or the current standard treatment). The causal effect, or treatment effect, is the difference between these two potential outcomes.
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||115||15
 +
|-
 +
!玛丽||120||125||−5
 +
|-
 +
!莎莉||100||125||−25
 +
|-
 +
!鲍勃||110||130||−20
 +
|-
 +
!詹姆士||115||120||−5
 +
|-
 +
!吝啬的||115||123||−8
  
 +
|}
  
 +
真正的平均因果效应是 -8。但是对这些人的因果效应永远不会等于这个平均值。因果效应各不相同,因为它通常(总是?)在现实生活中也是如此。在随机分配处理后,我们可以估计因果效应为:
  
 
{| class="wikitable" align="center"
 
{| class="wikitable" align="center"
  
! subject !! <math>Y_t(u)</math> !! <math>Y_c(u)</math> !! <math>Y_t(u) - Y_c(u)</math>
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
  
 
|-
 
|-
 +
!乔||130||?||?
 +
|-
 +
!玛丽||120||?||?
 +
|-
 +
!莎莉||?||125||?
 +
|-
 +
!鲍勃||?||130||?
 +
|-
 +
!詹姆士||115||?||?
 +
|-
 +
!吝啬的||121.66||127.5||−5.83
 +
 +
|}
 +
 +
处理的不同随机分配产生对平均因果效应的不同估计。
 +
 +
{| class="wikitable" align="center"
  
! Joe
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
  
Category:Causal inference
+
|-
 +
!乔||130||?||?
 +
|-
 +
!玛丽||120||?||?
 +
|-
 +
!莎莉||100||?||?
 +
|-
 +
!鲍勃||?||130||?
 +
|-
 +
!詹姆士||?||120||?
 +
|-
 +
!吝啬的||116.67||125||−8.33
  
类别: 因果推理
+
|}
  
|130 || 135 || −5
+
平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。
  
Category:Statistical models
+
或者,假设该机制将处理分配给所有男性且仅分配给他们。
  
类别: 统计模型
+
{| class="wikitable" align="center"
 +
 
 +
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||?||?
 +
|-
 +
!鲍勃||110||?||?
 +
|-
 +
!詹姆士||105||?||?
 +
|-
 +
!玛丽||?||130||?
 +
|-
 +
!莎莉||?||125||?
 +
|-
 +
!苏茜||?||135||?
 +
|-
 +
!吝啬的||115||130||−15
  
 
|}
 
|}
  
Category:Econometric models
+
在这种分配机制下,女性不可能接受处理,因此无法确定对女性受试者的平均因果效应。为了对受试者做出因果效应的任何推断,受试者接受治疗的概率必须大于 0 且小于 1。
  
类别: 计量经济学模型
+
===完美的医生===
  
 +
考虑使用完美医生作为分配机制。完美的医生知道每个受试者对药物或对照的反应如何,并为每个受试者分配对她最有益的处理。完美的医生知道有关患者样本的以下信息:
  
 +
{| class="wikitable" align="center"
  
Category:Observational study
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||130||115||15
 +
|-
 +
!鲍勃||120||125||−5
 +
|-
 +
!詹姆士||100||150||−50
 +
|-
 +
!玛丽||115||125||−10
 +
|-
 +
!莎莉||120||130||−10
 +
|-
 +
!苏茜||135||105||30
 +
|-
 +
!吝啬的||120||125||−5
  
类别: 观察性研究
+
|}
  
<math>Y_t(u)</math> is Joe's [[blood pressure]] if he takes the new pill.  In general, this notation expresses the potential outcome which results from a treatment, ''t'', on a unit, ''u''.  Similarly, <math>Y_c(u)</math> is the effect of a different treatment, ''c'' or control, on a unit, ''u''.  In this case, <math>Y_c(u)</math> is Joe's blood pressure if he doesn't take the pill.  <math>Y_t(u) - Y_c(u)</math> is the causal effect of taking the new drug.
+
基于这些知识,她将进行以下处理分配:
  
Category:Experiments
+
{| class="wikitable" align="center"
  
分类: 实验
+
!主题||<math>Y_{t}(u)</math>||<math>Y_{c}(u)</math>||<math>Y_{t}(u)-Y_{c}(u)</math>
 +
|-
 +
!乔||?||115||?
 +
|-
 +
!鲍勃||120||?||?
 +
|-
 +
!詹姆士||100||?||?
 +
|-
 +
!玛丽||115||?||?
 +
|-
 +
!莎莉||120||?||?
 +
|-
 +
!苏茜||?||105||?
 +
|-
 +
!吝啬的||113.75||110||3.75
 +
|}
 +
 
 +
完美的医生通过过滤掉对处理和控制的不良反应来扭曲这两个平均值。均值之间的差异,即假定的平均因果效应,在取决于细节的方向上发生扭曲。例如,像Susie这样因服药而受到伤害的受试者会被完美的医生分配到对照组,从而掩盖了药物的负面影响。
 +
 
 +
==结论==
 +
 
 +
在某个时间点对单个单位的处理的因果效应是经过处理和未经过处理的结果变量之间的差异。因果推断的基本问题是不可能观察到对单个单元的因果效应。你要么现在服用阿司匹林,要么不服用。因此,必须做出假设以估计缺失的反事实。
  
<noinclude>
+
Rubin 因果模型还与工具变量(Angrist、Imbens 和 Rubin,1996 年)<ref name="">Angrist J.,Imbens G.,Rubin D. (1996) [https://pattern.swarma.org/paper?id=86ab704a-c3ad-11eb-ab25-0242ac170007 Identification of Causal effects Using Instrumental Variables].J. Amer. Statist. Assoc.91.434:(444–455)</ref>和其他因果推断技术相关联。有关 Rubin 因果模型、结构方程建模和其他因果推断统计方法之间联系的更多信息,请参见 Morgan 和 Winship (2007)。<ref name="">Morgan S.,Winship C. (2007) [https://pattern.swarma.org/paper?id=b87f164e-c3ad-11eb-ba86-0242ac170007 Counterfactuals and Causal Inference: Methods and Principles for Social Research].</ref>
  
<small>This page was moved from [[wikipedia:en:Rubin causal model]]. Its edit history can be viewed at [[鲁宾因果框架/edithistory]]</small></noinclude>
+
==另见==
  
[[Category:待整理页面]]
+
- [https://en.wikipedia.org/wiki/Causality 因果关系]
 +
- [https://en.wikipedia.org/wiki/Principal_stratification 主要分层]
 +
- [https://en.wikipedia.org/wiki/Propensity_score_matching 倾向得分匹配]
 +
<noinclude>
 +
==参考文献==
 +
</noinclude>

2021年6月2日 (三) 22:21的版本

鲁宾因果模型 (RCM),也称为 Neyman-Rubin 因果模型,[1]是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 [2]潜在结果框架最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,[3]尽管他只在完全随机实验的背景下讨论了它。 [4]鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。[1]

介绍

鲁宾因果模型基于潜在结果的想法。例如,如果一个人上过大学,他在 40 岁时会有特定的收入,而如果他没有上过大学,他在 40 岁时会有不同的收入。为了衡量这个人上大学的因果效应,我们需要比较同一个人在两种不同的未来中的结果。由于不可能同时看到两种潜在结果,因此总是缺少其中一种潜在结果。这种困境就是“因果推理的基本问题”。

由于因果推理的根本问题,无法直接观察到单元级别的因果效应。然而,随机实验允许估计人口水平的因果效应。[5]随机实验将人们随机分配到对照组:大学或非大学。由于这种随机分配,各组(平均)相等,40 岁时的收入差异可归因于大学分配,因为这是各组之间的唯一差异。然后可以通过计算处理(上大学)和对照(非上大学)样本之间的平均值差异来获得平均因果效应(也称为平均处理效应)的估计值。

然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。

一个扩展案例

鲁宾定义了一个因果效应:

直观地说,一种处理 E 对另一种处理 C 的因果效应对于特定单位和从 [math]\displaystyle{ t_{1} }[/math][math]\displaystyle{ t_{2} }[/math] 是当时会发生的事情之间的差异 [math]\displaystyle{ t_{2} }[/math] 如果装置暴露于 E 开始于 [math]\displaystyle{ t_{1} }[/math] 以及会发生什么 [math]\displaystyle{ t_{2} }[/math] 如果该装置已暴露于 C 开始于[math]\displaystyle{ t_{1} }[/math]:“如果一个小时前我服用了两个阿司匹林而不是一杯水,我的头痛现在就会消失”,或者“因为一个小时前我服用了两个阿司匹林而不是一杯水,我的头痛现在消失了.' 我们对 E 与 C 处理的因果效应的定义将反映这种直观的含义。[5]

根据 RCM,您在一小时前服用或不服用阿司匹林的因果效应是您的头部在情况 1(服用阿司匹林)和情况 2(未服用阿司匹林)中的感受的差异。如果没有阿司匹林你的头痛仍然存在,但如果服用阿司匹林头痛就会消失,那么服用阿司匹林的因果效应是头痛缓解。在大多数情况下,我们对比较两种特性感兴趣,一种通常称为“处理”,另一种称为“控制”。这些标签有些随意。

潜在结果

假设 Joe 正在参加 FDA 对一种新的高血压药物的测试。如果我们无所不知,我们就会知道乔在处理(新药)和控制(未处理或当前标准处理)下的结果。因果效应或处理效应是这两种潜在结果之间的差异。

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 135 −5

如果乔服用新药丸,[math]\displaystyle{ Y_{t}(u) }[/math]就是他的血压。通常,该符号表示对单位u进行处理t 所产生的潜在结果。类似的,[math]\displaystyle{ Y_{c}(u) }[/math]是不同处理t或控制c对单元u的影响。在这种情况下,如果乔不服药,[math]\displaystyle{ Y_{c}(u) }[/math]就是他的血压。[math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math] 是服用新药的因果效应。

从这张表中我们只知道对 Joe 的因果效应。研究中的其他人如果服用避孕药,血压可能会升高。然而,不管对其他受试者的因果效应是什么,乔的因果效应是血压降低(相对于他没有服用避孕药时的血压)。

考虑更大的患者样本:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 135 −5
玛丽 140 150 −10
莎莉 135 125 10
鲍勃 135 150 −15

因果效应对于每一个主题是不同的,但药物对乔,玛丽和鲍勃都有影响,因为因果效应是负的。他们服用药物后的血压低于每个人不服用药物时的血压。另一方面,对于 Sally 来说,这种药物会导致血压升高。

为了使潜在结果有意义,它必须是可能的,至少是先验的。例如,如果乔在任何情况下都无法获得新药,那么[math]\displaystyle{ Y_{t}(u) }[/math]对他来说是不可能的。它永远不会发生。而如果[math]\displaystyle{ Y_{t}(u) }[/math]永远无法观察到(即使在理论上),那么对乔的血压的因果效应是不确定的。

没有操纵就没有因果关系

新药的因果效应是明确定义的,因为它是两种可能发生的潜在结果的简单差异。在这种情况下,我们(或其他事物)可以干预世界,至少在概念上是这样,因此可能会发生不同的事。

如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加成问题。例如,乔的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:Joe 在处理下的体重(处理被定义为高3英寸)和 Joe 在控制下的体重(控制被定义为他当前的身高)。

问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。

稳定单元处理值假设 (SUTVA)

我们要求“对一个单元的 [潜在结果] 观察不应受到其他单元的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为稳定单元处理值假设(SUTVA),它超越了独立性的概念。

在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,他的结果将取决于他接受的处理和玛丽接受的处理。

SUTVA 违规使因果推断更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。


主题 乔 = c,玛丽 = t 乔 = t,玛丽 = t 乔 = c,玛丽 = c 乔 = t,玛丽 = c
140 130 125 120

回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是玛丽接受处理时药物对乔的因果效应[math]\displaystyle{ 130-140 }[/math]。另一个是当玛丽没有接受处理时对乔的因果效应[math]\displaystyle{ 120-125 }[/math]。第三是在乔没有得到处理的情况下,玛丽的处理对乔的因果效应[math]\displaystyle{ 140-125 }[/math]。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。

通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何单位都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖单位的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。

平均因果效应

考虑:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 135 −5
玛丽 130 145 −15
莎莉 130 145 −15
鲍勃 140 150 −10
詹姆士 145 140 +5
吝啬的 135 143 −8

人们可以通过取所有因果效应的平均值来计算平均因果效应。

我们如何测量反馈效应会影响我们得出的推论。假设我们以百分比变化而不是绝对值来测量血压的变化。然后,根据确切的数字,平均因果效应可能是血压升高。例如,假设乔治的血压在控制下为 154,在处理后为 140。因果效应的绝对大小为 -14,但百分比差异(就 140 的处理水平而言)为 -10%。如果莎拉的血压在治疗下为 200,在控制下为 184,那么因果效应的绝对值是 16,而治疗值是 8%。乔治的血压绝对变化较小(-14 对 16)会产生较大的百分比变化(-10% 对 8%)。

因果推理的基本问题

到目前为止,我们所看到的结果永远无法在实践中衡量。根据定义,不可能在特定时间段内观察多种处理对受试者的影响。乔不能同时服用避孕药和不服用避孕药。因此,数据看起来像这样:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 ? ?

问号是无法观察到的反馈。因果推断的基本问题[2]是不可能直接观察因果效应。然而,这并不使因果推断成为不可能。某些技术和假设可以克服基本问题。

假设我们有以下数据:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 ? ?
玛丽 ? 125 ?
莎莉 100 ? ?
鲍勃 ? 130 ?
詹姆士 ? 120 ?
吝啬的 115 125 −10

如果我们假设效应恒定,我们可以推断出乔在控制下的潜在结果是什么:

[math]\displaystyle{ Y_{t}(u)=T+Y_{c}(u) }[/math][math]\displaystyle{ Y_{t}(u)-T=Y_{c}(u) }[/math]

如果我们想推断未观察到的值,我们可以假设一个恒定的影响。下表说明了与恒定效应假设一致的数据。

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 140 −10
玛丽 115 125 −10
莎莉 100 110 −10
鲍勃 120 130 −10
詹姆士 110 120 −10
吝啬的 115 125 −10

所有受试者即使在治疗下有不同的结果,也具有相同的因果效应。

分配机制

分配机制,即分配单位处理的方法,影响平均因果效应的计算。一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。如果我们希望五个受试者接受处理,我们可以将处理分配给我们从帽子里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。

假设这个数据是真实的:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 115 15
玛丽 120 125 −5
莎莉 100 125 −25
鲍勃 110 130 −20
詹姆士 115 120 −5
吝啬的 115 123 −8

真正的平均因果效应是 -8。但是对这些人的因果效应永远不会等于这个平均值。因果效应各不相同,因为它通常(总是?)在现实生活中也是如此。在随机分配处理后,我们可以估计因果效应为:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 ? ?
玛丽 120 ? ?
莎莉 ? 125 ?
鲍勃 ? 130 ?
詹姆士 115 ? ?
吝啬的 121.66 127.5 −5.83

处理的不同随机分配产生对平均因果效应的不同估计。

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 ? ?
玛丽 120 ? ?
莎莉 100 ? ?
鲍勃 ? 130 ?
詹姆士 ? 120 ?
吝啬的 116.67 125 −8.33

平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。

或者,假设该机制将处理分配给所有男性且仅分配给他们。

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 ? ?
鲍勃 110 ? ?
詹姆士 105 ? ?
玛丽 ? 130 ?
莎莉 ? 125 ?
苏茜 ? 135 ?
吝啬的 115 130 −15

在这种分配机制下,女性不可能接受处理,因此无法确定对女性受试者的平均因果效应。为了对受试者做出因果效应的任何推断,受试者接受治疗的概率必须大于 0 且小于 1。

完美的医生

考虑使用完美医生作为分配机制。完美的医生知道每个受试者对药物或对照的反应如何,并为每个受试者分配对她最有益的处理。完美的医生知道有关患者样本的以下信息:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
130 115 15
鲍勃 120 125 −5
詹姆士 100 150 −50
玛丽 115 125 −10
莎莉 120 130 −10
苏茜 135 105 30
吝啬的 120 125 −5

基于这些知识,她将进行以下处理分配:

主题 [math]\displaystyle{ Y_{t}(u) }[/math] [math]\displaystyle{ Y_{c}(u) }[/math] [math]\displaystyle{ Y_{t}(u)-Y_{c}(u) }[/math]
? 115 ?
鲍勃 120 ? ?
詹姆士 100 ? ?
玛丽 115 ? ?
莎莉 120 ? ?
苏茜 ? 105 ?
吝啬的 113.75 110 3.75

完美的医生通过过滤掉对处理和控制的不良反应来扭曲这两个平均值。均值之间的差异,即假定的平均因果效应,在取决于细节的方向上发生扭曲。例如,像Susie这样因服药而受到伤害的受试者会被完美的医生分配到对照组,从而掩盖了药物的负面影响。

结论

在某个时间点对单个单位的处理的因果效应是经过处理和未经过处理的结果变量之间的差异。因果推断的基本问题是不可能观察到对单个单元的因果效应。你要么现在服用阿司匹林,要么不服用。因此,必须做出假设以估计缺失的反事实。

Rubin 因果模型还与工具变量(Angrist、Imbens 和 Rubin,1996 年)[6]和其他因果推断技术相关联。有关 Rubin 因果模型、结构方程建模和其他因果推断统计方法之间联系的更多信息,请参见 Morgan 和 Winship (2007)。[7]

另见

- 因果关系 - 主要分层 - 倾向得分匹配

参考文献

  1. 1.0 1.1 Sekhon, Jasjeet (2007). "The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods". The Oxford Handbook of Political Methodology. http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf. 
  2. 2.0 2.1 Holland, Paul W. (1986). "Statistics and Causal Inference". J. Amer. Statist. Assoc. 81 (396): 945–960. doi:10.1080/01621459.1986.10478354. JSTOR 2289064.
  3. Neyman, Jerzy. Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes. Master's Thesis (1923). Excerpts reprinted in English, Statistical Science, Vol. 5, pp. 463–472. (D. M. Dabrowska, and T. P. Speed, Translators.)
  4. Rubin, Donald (2005). "Causal Inference Using Potential Outcomes". J. Amer. Statist. Assoc. 100 (469): 322–331. doi:10.1198/016214504000001880.
  5. 5.0 5.1 Rubin, Donald (1974). "Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies". J. Educ. Psychol. 66 (5): 688–701 [p. 689]. doi:10.1037/h0037350.
  6. Angrist J.,Imbens G.,Rubin D. (1996) Identification of Causal effects Using Instrumental Variables.J. Amer. Statist. Assoc.91.434:(444–455)
  7. Morgan S.,Winship C. (2007) Counterfactuals and Causal Inference: Methods and Principles for Social Research.