“潜在结果”的版本间的差异
第1行: | 第1行: | ||
− | |||
此词条由因果科学读书会词条梳理志愿者我是猫(74989)翻译审校,未经专家审核,带来阅读不便,请见谅。 | 此词条由因果科学读书会词条梳理志愿者我是猫(74989)翻译审校,未经专家审核,带来阅读不便,请见谅。 | ||
链接参考 | 链接参考 | ||
− | + | 鲁宾因果框架 - 集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织 (swarma.org) | |
− | + | What is the “Potential Outcomes” Framework | Sparkling Correlation | |
− | |||
− | == | + | == 概念来源 == |
+ | '''鲁宾因果模型 Rubin Causal Model (RCM)''' ,也称为 '''Neyman-Rubin 因果模型''',<ref name="sekhon">{{cite book |last=Sekhon |first=Jasjeet |chapter=The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods |title=The Oxford Handbook of Political Methodology |year=2007 |chapter-url=http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf }}</ref>是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 <ref name="holland:causal86">{{cite journal |last=Holland |first=Paul W. |title=Statistics and Causal Inference |journal=Journal of the American Statistical Association |volume=81 |issue=396 |year=1986 |pages=945–960 |jstor=2289064 |doi=10.1080/01621459.1986.10478354}}</ref> '''<font color="#ff8000"> 潜在结果框架 Potential Outcomes Framework</font>'''最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,<ref name="neyman:masters">Neyman, Jerzy. ''Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes.'' Master's Thesis (1923). Excerpts reprinted in English, Statistical Science, Vol. 5, pp. 463–472. (Dorota Dabrowska, and T. P. Speed, Translators.)</ref>尽管他只在完全随机实验的背景下讨论了它。 <ref name="Jasa1">{{cite journal |last=Rubin |first=Donald |year=2005 |title=Causal Inference Using Potential Outcomes |journal=Journal of the American Statistical Association|volume=100 |issue=469 |pages=322–331 |doi=10.1198/016214504000001880 }}</ref>鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。<ref name="sekhon" /> | ||
+ | |||
+ | == 思想介绍 == | ||
+ | 鲁宾因果模型是基于潜在结果的想法。例如,如果一个人上过大学,他在 40 岁时会有特定的收入,而如果他没有上过大学,他在 40 岁时会有不同的收入。为了衡量这个人上大学的因果效应,我们需要比较同一个人在两种不同的未来中的结果。由于不可能同时看到两种潜在结果,因此总是缺少其中一种潜在结果。这种困境就是“因果推理的基本问题”。 | ||
+ | |||
+ | 由于因果推理的根本问题,无法直接观察到单元级别的因果效应。然而,随机实验允许估计人口水平的因果效应。<ref name=":01">{{cite journal |last=Rubin |first=Donald |title=Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies |journal=Journal of Educational Psychology|volume=66 |issue=5 |year=1974 |pages=688–701 [p. 689] |doi=10.1037/h0037350 }}</ref>随机实验将人们随机分配到对照组:大学或非大学。由于这种随机分配,各组(平均)相等,40 岁时的收入差异可归因于大学分配,因为这是各组之间的唯一差异。然后可以通过计算处理(上大学)和对照(非上大学)样本之间的平均值差异来获得平均因果效应(也称为平均处理效应)的估计值。 | ||
+ | |||
+ | 然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。 | ||
+ | == 概念定义 == | ||
潜在结果:给定一个单元,和一系列动作,我们把一个“动作-单元”确定为一个潜在结果。“潜在(potential)”这个词表达的意思是我们并不总是能在现实中观察到这个结果(outcome),但原则上它们可能发生。 | 潜在结果:给定一个单元,和一系列动作,我们把一个“动作-单元”确定为一个潜在结果。“潜在(potential)”这个词表达的意思是我们并不总是能在现实中观察到这个结果(outcome),但原则上它们可能发生。 | ||
== 样例介绍 == | == 样例介绍 == | ||
− | |||
− | |||
【终译】假设乔正在参与 FDA 对一种新的高血压药物的测试。如果我们是无所不知的,我们就会知道乔在治疗组和控制组下的结果。我们想要探究的因果效应,或者说治疗效果,就是指这两种潜在结果之间的差异。 | 【终译】假设乔正在参与 FDA 对一种新的高血压药物的测试。如果我们是无所不知的,我们就会知道乔在治疗组和控制组下的结果。我们想要探究的因果效应,或者说治疗效果,就是指这两种潜在结果之间的差异。 | ||
{| class="wikitable" | {| class="wikitable" | ||
第27行: | 第32行: | ||
|−5 | |−5 | ||
|} | |} | ||
− | |||
− | |||
【终译】 Yt(u) 表示如果乔服用了这种新药物之后对应的血压。一般来说,这个符号表示一个单位 u 上的治疗结果 t 的潜在结果。类似地,Yc (u)是一个单位 u 上的不同治疗效果 c 的潜在结果或控制组的结果。Yc (u)若表示控制组,则在这种情况下,Yt (u)-Yc (u)就是表示乔不吃这种新药物时的血压,也就是服用这种新药物的因果效应。 | 【终译】 Yt(u) 表示如果乔服用了这种新药物之后对应的血压。一般来说,这个符号表示一个单位 u 上的治疗结果 t 的潜在结果。类似地,Yc (u)是一个单位 u 上的不同治疗效果 c 的潜在结果或控制组的结果。Yc (u)若表示控制组,则在这种情况下,Yt (u)-Yc (u)就是表示乔不吃这种新药物时的血压,也就是服用这种新药物的因果效应。 | ||
− | |||
− | |||
【终译】从这个表格中我们只知道对乔的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于乔来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。 | 【终译】从这个表格中我们只知道对乔的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于乔来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。 | ||
− | |||
− | |||
【终译】考虑更为大量的病患样本 | 【终译】考虑更为大量的病患样本 | ||
第64行: | 第63行: | ||
|−15 | |−15 | ||
|} | |} | ||
− | |||
− | |||
【终译】每个实验对象的因果效应是不同的,从该表中,可知效应为负值,说明药物仅对乔,玛丽和鲍勃起作用。他们服用这种药物后的血压比没有服用这种药物时的血压要低。另一方面,对于 Sally 来说,这种药物会导致血压升高。 | 【终译】每个实验对象的因果效应是不同的,从该表中,可知效应为负值,说明药物仅对乔,玛丽和鲍勃起作用。他们服用这种药物后的血压比没有服用这种药物时的血压要低。另一方面,对于 Sally 来说,这种药物会导致血压升高。 | ||
− | |||
− | |||
【终译】为了让一个潜在的结果有意义,它必须是可能的,至少是先验的。例如,如果乔在任何情况下都没有办法获得新药,那么他就不可能获得效应。这永远不可能发生在乔身上。如果不能观察到效应,即使在理论上,那么治疗对乔的血压的因果效应也不能确定。 | 【终译】为了让一个潜在的结果有意义,它必须是可能的,至少是先验的。例如,如果乔在任何情况下都没有办法获得新药,那么他就不可能获得效应。这永远不可能发生在乔身上。如果不能观察到效应,即使在理论上,那么治疗对乔的血压的因果效应也不能确定。 | ||
第78行: | 第73行: | ||
问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。 | 问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。 | ||
+ | |||
+ | == 稳定单元处理值假设 (SUTVA) == | ||
+ | 我们要求“对一个单元的 [潜在结果] 观察不应受到其他单元的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为稳定单元处理值假设(SUTVA),它超越了独立性的概念。 | ||
+ | |||
+ | 在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,他的结果将取决于他接受的处理和玛丽接受的处理。 | ||
+ | |||
+ | 在不满足SUTVA的情况下,因果推断会更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。 | ||
+ | {| class="wikitable" align="center" | ||
+ | !主题||乔 = c,玛丽 = t||乔 = t,玛丽 = t||乔 = c,玛丽 = c||乔 = t,玛丽 = c | ||
+ | |- | ||
+ | !乔||140||130||125||120 | ||
+ | |} | ||
+ | 回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是玛丽接受处理时药物对乔的因果效应【130-140】。另一个是当玛丽没有接受处理时对乔的因果效应【120-125】。第三是在乔没有得到处理的情况下,玛丽的处理对乔的因果效应【125-140】。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。 | ||
+ | |||
+ | 通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何单位都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖单位的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。 | ||
+ | |||
+ | == 分配机制 == | ||
+ | 分配机制,即分配单位处理的方法,影响平均因果效应的计算。换句话说,当把一个接受治疗的组和一个没有接受治疗的组进行比较时,我们需要知道(或者做出一个假设)为什么某些人被分配到治疗组,而其他人没有。 | ||
+ | |||
+ | 一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。在最简单的情况下,这种分配是随机的(就像在临床试验中一样) ,而且不会混淆,因为分配并不依赖于潜在的结果。 | ||
+ | |||
+ | 如果我们希望五个受试者接受处理,我们可以将处理分配给我们从组里里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。 | ||
+ | |||
+ | 另一种分配机制是非随机化的,如果所有接受治疗的个体都是因为他们最有可能受益而接受治疗,那么治疗结果和对照组之间的直接比较不能代表治疗的因果效应。 | ||
+ | |||
+ | 从以下这个例子来理解分配机制,假设这个数据是真实的: | ||
+ | {| class="wikitable" align="center" | ||
+ | !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) | ||
+ | |- | ||
+ | !乔||130||115||15 | ||
+ | |- | ||
+ | !玛丽||120||125||−5 | ||
+ | |- | ||
+ | !莎莉||100||125||−25 | ||
+ | |- | ||
+ | !鲍勃||110||130||−20 | ||
+ | |- | ||
+ | !詹姆士||115||120||−5 | ||
+ | |- | ||
+ | !平均||115||123||−8 | ||
+ | |}真正的平均因果效应是 -8。但是对这些人的因果效应永远不会等于这个平均值。因果效应各不相同,因为它通常(总是未知(?))在现实生活中也是如此。在随机分配处理后,我们可以估计因果效应为: | ||
+ | {| class="wikitable" align="center" | ||
+ | !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) | ||
+ | |- | ||
+ | !乔||130||?||? | ||
+ | |- | ||
+ | !玛丽||120||?||? | ||
+ | |- | ||
+ | !莎莉||?||125||? | ||
+ | |- | ||
+ | !鲍勃||?||130||? | ||
+ | |- | ||
+ | !詹姆士||115||?||? | ||
+ | |- | ||
+ | !平均||121.66||127.5||−5.83 | ||
+ | |} | ||
+ | |||
+ | |||
+ | 处理的不同随机分配产生对平均因果效应的不同估计。 | ||
+ | {| class="wikitable" align="center" | ||
+ | !主题||Y_{t}(u)||Y_{c}(u) | ||
+ | !Y_{t}(u)-Y_{c}(u) | ||
+ | |- | ||
+ | !乔||130||?||? | ||
+ | |- | ||
+ | !玛丽||120||?||? | ||
+ | |- | ||
+ | !莎莉||100||?||? | ||
+ | |- | ||
+ | !鲍勃||?||130||? | ||
+ | |- | ||
+ | !詹姆士||?||120||? | ||
+ | |- | ||
+ | !平均||116.67||125||−8.33 | ||
+ | |}平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。 | ||
+ | |||
+ | 或者,假设该机制将处理分配给所有男性且仅分配给他们。 | ||
+ | {| class="wikitable" align="center" | ||
+ | !主题||Y_{t}(u)||Y_{c}(u) | ||
+ | !Y_{t}(u)-Y_{c}(u) | ||
+ | |- | ||
+ | !乔||130||?||? | ||
+ | |- | ||
+ | !鲍勃||110||?||? | ||
+ | |- | ||
+ | !詹姆士||105||?||? | ||
+ | |- | ||
+ | !玛丽||?||130||? | ||
+ | |- | ||
+ | !莎莉||?||125||? | ||
+ | |- | ||
+ | !苏茜||?||135||? | ||
+ | |- | ||
+ | !平均||115||130||−15 | ||
+ | |}在这种分配机制下,女性不可能接受处理,因此无法确定对女性受试者的平均因果效应。为了对受试者做出因果效应的任何推断,受试者接受治疗的概率必须大于 0 且小于 1。 | ||
+ | |||
+ | == 另见 == | ||
+ | |||
+ | * [[鲁宾因果框架]] | ||
+ | |||
+ | == 参考文献 == | ||
+ | <references /> |
2022年6月5日 (日) 15:24的版本
此词条由因果科学读书会词条梳理志愿者我是猫(74989)翻译审校,未经专家审核,带来阅读不便,请见谅。
链接参考
鲁宾因果框架 - 集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织 (swarma.org)
What is the “Potential Outcomes” Framework | Sparkling Correlation
概念来源
鲁宾因果模型 Rubin Causal Model (RCM) ,也称为 Neyman-Rubin 因果模型,[1]是一种基于潜在结果框架的因果统计分析方法,以Donald Rubin的名字命名。“鲁宾因果模型”这个名字最早是由 Paul W. Holland 创造的。 [2] 潜在结果框架 Potential Outcomes Framework最初是由 Jerzy Neyman 在他 1923 年的硕士论文中提出的,[3]尽管他只在完全随机实验的背景下讨论了它。 [4]鲁宾将其扩展为在观察性和实验性研究中思考因果关系的一般框架。[1]
思想介绍
鲁宾因果模型是基于潜在结果的想法。例如,如果一个人上过大学,他在 40 岁时会有特定的收入,而如果他没有上过大学,他在 40 岁时会有不同的收入。为了衡量这个人上大学的因果效应,我们需要比较同一个人在两种不同的未来中的结果。由于不可能同时看到两种潜在结果,因此总是缺少其中一种潜在结果。这种困境就是“因果推理的基本问题”。
由于因果推理的根本问题,无法直接观察到单元级别的因果效应。然而,随机实验允许估计人口水平的因果效应。[5]随机实验将人们随机分配到对照组:大学或非大学。由于这种随机分配,各组(平均)相等,40 岁时的收入差异可归因于大学分配,因为这是各组之间的唯一差异。然后可以通过计算处理(上大学)和对照(非上大学)样本之间的平均值差异来获得平均因果效应(也称为平均处理效应)的估计值。
然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
概念定义
潜在结果:给定一个单元,和一系列动作,我们把一个“动作-单元”确定为一个潜在结果。“潜在(potential)”这个词表达的意思是我们并不总是能在现实中观察到这个结果(outcome),但原则上它们可能发生。
样例介绍
【终译】假设乔正在参与 FDA 对一种新的高血压药物的测试。如果我们是无所不知的,我们就会知道乔在治疗组和控制组下的结果。我们想要探究的因果效应,或者说治疗效果,就是指这两种潜在结果之间的差异。
subject | Yt(u) | Yc (u) | Yt (u)-Yc (u) |
---|---|---|---|
Joe | 130 | 135 | −5 |
【终译】 Yt(u) 表示如果乔服用了这种新药物之后对应的血压。一般来说,这个符号表示一个单位 u 上的治疗结果 t 的潜在结果。类似地,Yc (u)是一个单位 u 上的不同治疗效果 c 的潜在结果或控制组的结果。Yc (u)若表示控制组,则在这种情况下,Yt (u)-Yc (u)就是表示乔不吃这种新药物时的血压,也就是服用这种新药物的因果效应。
【终译】从这个表格中我们只知道对乔的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于乔来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。
【终译】考虑更为大量的病患样本
subject | Yt(u) | Yc (u) | Yt (u)-Yc (u) |
---|---|---|---|
Joe | 130 | 135 | −5 |
Mary | 140 | 150 | −10 |
Sally | 135 | 125 | 10 |
Bob | 135 | 150 | −15 |
【终译】每个实验对象的因果效应是不同的,从该表中,可知效应为负值,说明药物仅对乔,玛丽和鲍勃起作用。他们服用这种药物后的血压比没有服用这种药物时的血压要低。另一方面,对于 Sally 来说,这种药物会导致血压升高。
【终译】为了让一个潜在的结果有意义,它必须是可能的,至少是先验的。例如,如果乔在任何情况下都没有办法获得新药,那么他就不可能获得效应。这永远不可能发生在乔身上。如果不能观察到效应,即使在理论上,那么治疗对乔的血压的因果效应也不能确定。
没有操纵就没有因果关系
新药的因果效应是明确定义的,因为它是两种可能发生的潜在结果的简单差异。在这种情况下,我们(或其他事物)可以干预世界,至少在概念上是这样,因此可能会发生不同的事。
如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加棘手。例如,乔的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:Joe 在处理下的体重(处理被定义为高3英寸)和 Joe 在控制下的体重(控制被定义为他当前的身高)。
问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。
稳定单元处理值假设 (SUTVA)
我们要求“对一个单元的 [潜在结果] 观察不应受到其他单元的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为稳定单元处理值假设(SUTVA),它超越了独立性的概念。
在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,他的结果将取决于他接受的处理和玛丽接受的处理。
在不满足SUTVA的情况下,因果推断会更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。
主题 | 乔 = c,玛丽 = t | 乔 = t,玛丽 = t | 乔 = c,玛丽 = c | 乔 = t,玛丽 = c |
---|---|---|---|---|
乔 | 140 | 130 | 125 | 120 |
回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是玛丽接受处理时药物对乔的因果效应【130-140】。另一个是当玛丽没有接受处理时对乔的因果效应【120-125】。第三是在乔没有得到处理的情况下,玛丽的处理对乔的因果效应【125-140】。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。
通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何单位都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖单位的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。
分配机制
分配机制,即分配单位处理的方法,影响平均因果效应的计算。换句话说,当把一个接受治疗的组和一个没有接受治疗的组进行比较时,我们需要知道(或者做出一个假设)为什么某些人被分配到治疗组,而其他人没有。
一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。在最简单的情况下,这种分配是随机的(就像在临床试验中一样) ,而且不会混淆,因为分配并不依赖于潜在的结果。
如果我们希望五个受试者接受处理,我们可以将处理分配给我们从组里里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。
另一种分配机制是非随机化的,如果所有接受治疗的个体都是因为他们最有可能受益而接受治疗,那么治疗结果和对照组之间的直接比较不能代表治疗的因果效应。
从以下这个例子来理解分配机制,假设这个数据是真实的:
主题 | Y_{t}(u) | Y_{c}(u) | Y_{t}(u)-Y_{c}(u) |
---|---|---|---|
乔 | 130 | 115 | 15 |
玛丽 | 120 | 125 | −5 |
莎莉 | 100 | 125 | −25 |
鲍勃 | 110 | 130 | −20 |
詹姆士 | 115 | 120 | −5 |
平均 | 115 | 123 | −8 |
真正的平均因果效应是 -8。但是对这些人的因果效应永远不会等于这个平均值。因果效应各不相同,因为它通常(总是未知(?))在现实生活中也是如此。在随机分配处理后,我们可以估计因果效应为:
主题 | Y_{t}(u) | Y_{c}(u) | Y_{t}(u)-Y_{c}(u) |
---|---|---|---|
乔 | 130 | ? | ? |
玛丽 | 120 | ? | ? |
莎莉 | ? | 125 | ? |
鲍勃 | ? | 130 | ? |
詹姆士 | 115 | ? | ? |
平均 | 121.66 | 127.5 | −5.83 |
处理的不同随机分配产生对平均因果效应的不同估计。
主题 | Y_{t}(u) | Y_{c}(u) | Y_{t}(u)-Y_{c}(u) |
---|---|---|---|
乔 | 130 | ? | ? |
玛丽 | 120 | ? | ? |
莎莉 | 100 | ? | ? |
鲍勃 | ? | 130 | ? |
詹姆士 | ? | 120 | ? |
平均 | 116.67 | 125 | −8.33 |
平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。
或者,假设该机制将处理分配给所有男性且仅分配给他们。
主题 | Y_{t}(u) | Y_{c}(u) | Y_{t}(u)-Y_{c}(u) |
---|---|---|---|
乔 | 130 | ? | ? |
鲍勃 | 110 | ? | ? |
詹姆士 | 105 | ? | ? |
玛丽 | ? | 130 | ? |
莎莉 | ? | 125 | ? |
苏茜 | ? | 135 | ? |
平均 | 115 | 130 | −15 |
在这种分配机制下,女性不可能接受处理,因此无法确定对女性受试者的平均因果效应。为了对受试者做出因果效应的任何推断,受试者接受治疗的概率必须大于 0 且小于 1。
另见
参考文献
- ↑ 1.0 1.1 Sekhon, Jasjeet (2007). "The Neyman–Rubin Model of Causal Inference and Estimation via Matching Methods". The Oxford Handbook of Political Methodology. http://sekhon.berkeley.edu/papers/SekhonOxfordHandbook.pdf.
- ↑ Holland, Paul W. (1986). "Statistics and Causal Inference". Journal of the American Statistical Association. 81 (396): 945–960. doi:10.1080/01621459.1986.10478354. JSTOR 2289064.
- ↑ Neyman, Jerzy. Sur les applications de la theorie des probabilites aux experiences agricoles: Essai des principes. Master's Thesis (1923). Excerpts reprinted in English, Statistical Science, Vol. 5, pp. 463–472. (Dorota Dabrowska, and T. P. Speed, Translators.)
- ↑ Rubin, Donald (2005). "Causal Inference Using Potential Outcomes". Journal of the American Statistical Association. 100 (469): 322–331. doi:10.1198/016214504000001880.
- ↑ Rubin, Donald (1974). "Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies". Journal of Educational Psychology. 66 (5): 688–701 [p. 689]. doi:10.1037/h0037350.