更改

添加7字节 、 2022年6月10日 (五) 22:06
第2行: 第2行:     
== 概念来源 ==
 
== 概念来源 ==
 +
潜在结果是指给定一个单元,和一系列动作,我们把一个“动作-单元”确定为一个潜在结果。“潜在(potential)”这个词表达的意思是我们并不总是能在现实中观察到这个结果(outcome),但原则上它们可能发生。
 +
 
潜在结果最初的提出是在Neyman的论文中,但是这篇文章只在随机对照试验中使用了潜在结果的概念,且直到1990年翻译成英文后才为人所知。Rubin在他1974年的论文中也提出了潜在结果的概念,并将这个概念推广到了观察性数据中,真正开启了统计学界对因果推断的广泛研究。
 
潜在结果最初的提出是在Neyman的论文中,但是这篇文章只在随机对照试验中使用了潜在结果的概念,且直到1990年翻译成英文后才为人所知。Rubin在他1974年的论文中也提出了潜在结果的概念,并将这个概念推广到了观察性数据中,真正开启了统计学界对因果推断的广泛研究。
   第18行: 第20行:  
使用潜在结果我们或许可以理解为什么人们不会认为“太阳升起是因为鸡打鸣”,因为根据我们的常识,如果某天鸡不打鸣(或许是因为生病或劳累),太阳仍然会照常升起。
 
使用潜在结果我们或许可以理解为什么人们不会认为“太阳升起是因为鸡打鸣”,因为根据我们的常识,如果某天鸡不打鸣(或许是因为生病或劳累),太阳仍然会照常升起。
   −
'''与此同时,也诞生了<font color="#ff8000">潜在结果框架,有时也称为</font>鲁宾因果模型 Rubin Causal Model (RCM)''' ,'''Neyman-Rubin 因果模型'''<ref name="sekhon">{{cite book |last=Sekhon |first=Jasjeet |chapter=The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods |title=The Oxford Handbook of Political Methodology |year=2007 |chapter-url=http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf }}</ref>。它是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 <ref name="holland:causal86">{{cite journal |last=Holland |first=Paul W. |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association |volume=81 |issue=396 |year=1986 |pages=945–960 |jstor=2289064 |doi=10.1080/01621459.1986.10478354}}</ref> '''<font color="#ff8000"> 潜在结果框架 Potential Outcomes Framework</font>'''最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,<ref name="neyman:masters">Neyman, Jerzy. ''Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes.'' Master's Thesis (1923).  Excerpts reprinted in English, Statistical Science, Vol. 5, pp.&nbsp;463–472. (Dorota Dabrowska, and T. P. Speed, Translators.)</ref>尽管他只在完全随机实验的背景下讨论了它。 <ref name="Jasa1">{{cite journal |last=Rubin |first=Donald |year=2005 |title=Causal Inference Using Potential Outcomes |journal=Journal of the American Statistical Association|volume=100 |issue=469 |pages=322–331 |doi=10.1198/016214504000001880 }}</ref>鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。<ref name="sekhon" />
+
'''因此从分析潜在结果出发,诞生了<font color="#ff8000">潜在结果框架,有时也称为</font>鲁宾因果模型 Rubin Causal Model (RCM)''' ,'''Neyman-Rubin 因果模型'''<ref name="sekhon">{{cite book |last=Sekhon |first=Jasjeet |chapter=The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods |title=The Oxford Handbook of Political Methodology |year=2007 |chapter-url=http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf }}</ref>。它是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 <ref name="holland:causal86">{{cite journal |last=Holland |first=Paul W. |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association |volume=81 |issue=396 |year=1986 |pages=945–960 |jstor=2289064 |doi=10.1080/01621459.1986.10478354}}</ref> '''<font color="#ff8000"> 潜在结果框架 Potential Outcomes Framework</font>'''最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,<ref name="neyman:masters">Neyman, Jerzy. ''Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes.'' Master's Thesis (1923).  Excerpts reprinted in English, Statistical Science, Vol. 5, pp.&nbsp;463–472. (Dorota Dabrowska, and T. P. Speed, Translators.)</ref>尽管他只在完全随机实验的背景下讨论了它。 <ref name="Jasa1">{{cite journal |last=Rubin |first=Donald |year=2005 |title=Causal Inference Using Potential Outcomes |journal=Journal of the American Statistical Association|volume=100 |issue=469 |pages=322–331 |doi=10.1198/016214504000001880 }}</ref>鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。<ref name="sekhon" />
    
== 思想介绍 ==
 
== 思想介绍 ==
第26行: 第28行:     
然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
 
然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
== 概念定义 ==
  −
潜在结果:给定一个单元,和一系列动作,我们把一个“动作-单元”确定为一个潜在结果。“潜在(potential)”这个词表达的意思是我们并不总是能在现实中观察到这个结果(outcome),但原则上它们可能发生。
  −
   
== 样例介绍 ==
 
== 样例介绍 ==
 
假设乔正在参与 FDA 对一种新的高血压药物的测试。如果我们是无所不知的,我们就会知道乔在治疗组和控制组下的结果。我们想要探究的因果效应,或者说治疗效果,就是指这两种潜在结果之间的差异。
 
假设乔正在参与 FDA 对一种新的高血压药物的测试。如果我们是无所不知的,我们就会知道乔在治疗组和控制组下的结果。我们想要探究的因果效应,或者说治疗效果,就是指这两种潜在结果之间的差异。
第42行: 第41行:  
|−5
 
|−5
 
|}
 
|}
Yt(u) 表示如果Joe服用了这种新药物之后对应的血压。一般来说,这个符号表示在个体 u 上的实施治疗 t 的潜在结果。类似地,Yc (u)是在个体 u 上的不做治疗(控制 )c 的潜在结果,即Yc (u)表示Joe不吃这种新药物时对应的血压。则在这种情况下,Yt (u)-Yc (u)也就是服用这种新药物对Joe的血压的因果效应。
+
Y<sub>t</sub>(u) 表示如果Joe服用了这种新药物之后对应的血压。一般来说,这个符号表示在个体 u 上的实施治疗 t 的潜在结果。类似地,Yc (u)是在个体 u 上的不做治疗(控制 )c 的潜在结果,即Yc (u)表示Joe不吃这种新药物时对应的血压。则在这种情况下,Yt (u)-Yc (u)也就是服用这种新药物对Joe的血压的因果效应。
    
从这个表格中我们只知道对Joe的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于Joe来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。
 
从这个表格中我们只知道对Joe的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于Joe来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。
第95行: 第94行:  
!乔||140||130||125||120
 
!乔||140||130||125||120
 
|}
 
|}
回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是Mary接受处理时药物对Joe的因果效应【130-140】。另一个是当Mary没有接受处理时对Joe的因果效应【120-125】。第三是在Joe没有得到处理的情况下,Mary的处理对Joe的因果效应【125-140】。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。
+
回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是Mary接受处理时药物对Joe的因果效应{130,140}。另一个是当Mary没有接受处理时对Joe的因果效应{120,125}。第三是在Joe没有得到处理的情况下,Mary的处理对Joe的因果效应{125,140}。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。
    
通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何个体都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖个体的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。
 
通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何个体都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖个体的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。
316

个编辑