第6行: |
第6行: |
| 潜在结果最初的提出是在Neyman的论文中,但是这篇文章只在随机对照试验中使用了潜在结果的概念,且直到1990年翻译成英文后才为人所知。Rubin在他1974年的论文中也提出了潜在结果的概念,并将这个概念推广到了观察性数据中,真正开启了统计学界对因果推断的广泛研究。 | | 潜在结果最初的提出是在Neyman的论文中,但是这篇文章只在随机对照试验中使用了潜在结果的概念,且直到1990年翻译成英文后才为人所知。Rubin在他1974年的论文中也提出了潜在结果的概念,并将这个概念推广到了观察性数据中,真正开启了统计学界对因果推断的广泛研究。 |
| | | |
− | 何为潜在结果?又如何基于潜在结果定义因果?假设我们关心某个变量A(例如,在某个时间点是否服用阿莫西林,A=1是服用,A=0是没有服用)对Y(服用后三小时的是否还感冒,Y=1表示感冒,Y=0表示没有感冒)的因果关系。那么我们观察到的某个个体就存在两个“潜在”的状态:一个是如果他服药,他三小时后是否感冒,不妨记作Y(1);另一个如果他没有服药,他三小时后是否感冒,不妨记作Y(0)。这里Y(1)和Y(0)就是潜在结果。(注意,在实际中,Y(1)和Y(0)这二者中只有一个可以被观察到。另外,严格地说,此处实际上做了“个体处理性稳定性”即SUTVA的假设)那么对这个人,就可能有以下四种情况: | + | 何为潜在结果?又如何基于潜在结果定义因果?假设我们关心某个变量A(例如,在某个时间点是否服用阿莫西林,A=1是服用,A=0是没有服用)对Y(服用后三小时的是否还感冒,Y=1表示感冒,Y=0表示没有感冒)的因果关系。那么我们观察到的某个个体就存在两个“潜在”的状态:一个是如果他服药,他三小时后是否感冒,不妨记作Y(1);另一个如果他没有服药,他三小时后是否感冒,不妨记作Y(0)。这里Y(1)和Y(0)就是潜在结果。(注意,在实际中,Y(1)和Y(0)这二者中只有一个可以被观察到。另外,严格地说,此处实际上做了“个体处理稳定性”即SUTVA的假设)那么对这个人,就可能有以下四种情况: |
| | | |
| a) Y(0)=0, Y(1)=0。即不论吃不吃药,这个人在三小时后均不会感冒。 | | a) Y(0)=0, Y(1)=0。即不论吃不吃药,这个人在三小时后均不会感冒。 |
第36行: |
第36行: |
| !Yt (u)-Yc (u) | | !Yt (u)-Yc (u) |
| |- | | |- |
− | !Joe | + | !乔 |
| |130 | | |130 |
| |135 | | |135 |
| |−5 | | |−5 |
| |} | | |} |
− | Y<sub>t</sub>(u) 表示如果Joe服用了这种新药物之后对应的血压。一般来说,这个符号表示在个体 u 上的实施治疗 t 的潜在结果。类似地,Yc (u)是在个体 u 上的不做治疗(控制 )c 的潜在结果,即Yc (u)表示Joe不吃这种新药物时对应的血压。则在这种情况下,Yt (u)-Yc (u)也就是服用这种新药物对Joe的血压的因果效应。 | + | Y<sub>t</sub>(u) 表示如果乔服用了这种新药物之后对应的血压。一般来说,这个符号表示在个体 u 上的实施治疗 t 的潜在结果。类似地,Yc (u)是在个体 u 上的不做治疗(控制 )c 的潜在结果,即Yc (u)表示乔不吃这种新药物时对应的血压。则在这种情况下,Yt (u)-Yc (u)也就是服用这种新药物对乔的血压的因果效应。 |
| | | |
− | 从这个表格中我们只知道对Joe的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于Joe来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。
| + | 从这个表格中我们只知道对乔的因果效应。研究中的其他人如果服用新药,血压可能会升高。然而,不管其他受试者的因果效应如何,我们可以得出结论,对于乔来说,相比于他没有服用新药的情况,服用该药,他的血压会降低。 |
| | | |
| 考虑更多的病患样本 | | 考虑更多的病患样本 |
第52行: |
第52行: |
| !Yt (u)-Yc (u) | | !Yt (u)-Yc (u) |
| |- | | |- |
− | !Joe | + | !乔 |
| |130 | | |130 |
| |135 | | |135 |
| |−5 | | |−5 |
| |- | | |- |
− | !Mary | + | !玛丽 |
| |140 | | |140 |
| |150 | | |150 |
| |−10 | | |−10 |
| |- | | |- |
− | !Sally | + | !莎莉 |
| |135 | | |135 |
| |125 | | |125 |
| |10 | | |10 |
| |- | | |- |
− | !Bob | + | !鲍勃 |
| |135 | | |135 |
| |150 | | |150 |
| |−15 | | |−15 |
| |} | | |} |
− | 每个实验对象的因果效应是不同的。从该表中可知Joe,Mary和Bob的因果效应为负值,说明药物仅对Joe,Mary和Bob起作用。他们服用这种药物后的血压比没有服用这种药物时的血压要低。另一方面,对于Sally 来说,这种药物会导致血压升高。
| + | 每个实验对象的因果效应是不同的。从该表中可知乔,玛丽和鲍勃的因果效应为负值,说明药物仅对乔,玛丽和鲍勃起作用。他们服用这种药物后的血压比没有服用这种药物时的血压要低。另一方面,对于莎莉 来说,这种药物会导致血压升高。 |
| | | |
− | 为了让一个潜在的结果有意义,它必须是可测试的,至少是先验的。例如,如果Joe在任何情况下都没有办法获得新药,那么他就不可能获得效应。这永远不可能发生在Joe身上。如果不能观察到效应,即使在理论上,那么治疗对Joe的血压的因果效应也不能确定。
| + | 为了让一个潜在的结果有意义,它必须是可测试的,至少是先验的。例如,如果乔在任何情况下都没有办法获得新药,那么他就不可能获得效应。这永远不可能发生在乔身上。如果不能观察到效应,即使在理论上,那么治疗对乔的血压的因果效应也不能确定。 |
| | | |
| == 没有干预就没有因果关系 == | | == 没有干预就没有因果关系 == |
| 新药的因果效应是明确定义的,因为它是两种可能发生的潜在结果的简单差异。在这种情况下,我们(或其他事物)可以干预世界,至少在概念上是这样,因此可能会发生不同的事。 | | 新药的因果效应是明确定义的,因为它是两种可能发生的潜在结果的简单差异。在这种情况下,我们(或其他事物)可以干预世界,至少在概念上是这样,因此可能会发生不同的事。 |
| | | |
− | 如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加棘手。例如,Joe的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:Joe 在处理下的体重(处理被定义为增高3英寸)和 Joe 在控制下的体重(控制被定义为他当前的身高)。
| + | 如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加棘手。例如,乔的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:乔 在处理下的体重(处理被定义为增高3英寸)和 乔 在控制下的体重(控制被定义为他当前的身高)。 |
| | | |
− | 问题在于:我们无法增加Joe的身高。没有办法观察如果Joe更高,他的体重会是多少,因为我们没有办法干预Joe的身高从而让他变得更高,这就让研究Joe的身高和体重的因果关系变得没有意义。因此有一个口号:没有干预就没有因果关系。
| + | 问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为我们没有办法干预乔的身高从而让他变得更高,这就让研究乔的身高和体重的因果关系变得没有意义。因此有一个口号:没有干预就没有因果关系。 |
| | | |
| == 个体处理稳定性假设 (SUTVA) == | | == 个体处理稳定性假设 (SUTVA) == |
− | 我们要求“对一个个体的 [潜在结果] 观察不应受到其他个体的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为个体处理稳定性假设(SUTVA),它超越了独立性的概念。
| + | 我们要求“对一个个体 [潜在结果] 的观察不应受到其他个体的特定处理分配的影响”(Cox 1958,第 2.4 节)。这被称为个体处理稳定性假设(SUTVA),它超越了独立性的概念。 |
| | | |
− | 在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设Joe和Mary住在同一所房子里,Mary总是做饭。这种药物会导致Mary渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加Joe的血压。因此,Joe的血压结果将同时取决于他接受的处理和Mary接受的处理。
| + | 在我们的例子中,乔 的血压不应该取决于 玛丽 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,乔的血压结果将同时取决于他接受的处理和玛丽接受的处理。 |
| | | |
− | 在不满足SUTVA的情况下,因果推断会更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。 | + | 在不满足SUTVA的情况下,因果推断会更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 玛丽 是否接受处理来创建 4 个处理。 |
| {| class="wikitable" align="center" | | {| class="wikitable" align="center" |
| !主题||乔 = c,玛丽 = t||乔 = t,玛丽 = t||乔 = c,玛丽 = c||乔 = t,玛丽 = c | | !主题||乔 = c,玛丽 = t||乔 = t,玛丽 = t||乔 = c,玛丽 = c||乔 = t,玛丽 = c |
第94行: |
第94行: |
| !乔||140||130||125||120 | | !乔||140||130||125||120 |
| |} | | |} |
− | 回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是Mary接受处理时药物对Joe的因果效应{130,140}。另一个是当Mary没有接受处理时对Joe的因果效应{120,125}。第三是在Joe没有得到处理的情况下,Mary的处理对Joe的因果效应{125,140}。Mary 接受的处理对 Joe 的因果影响比 Joe 接受的处理对 Joe 的影响更大,而且是相反的方向。
| + | 回想一下,因果效应被定义为两个潜在结果之间的差异。在这种情况下,存在多种因果效应,因为存在两个以上的潜在结果。一是玛丽接受处理时药物对乔的因果效应{130,140}。另一个是当玛丽没有接受处理时对乔的因果效应{120,125}。第三是在乔没有得到处理的情况下,玛丽的处理对乔的因果效应{125,140}。玛丽 接受的处理对 乔 的因果影响比 乔 接受的处理对 乔 的影响更大,而且是相反的方向。 |
| | | |
− | 通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何个体都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖个体的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。 | + | 通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 乔 以外的任何个体都依赖于 玛丽,那么我们必须考虑进一步的潜在结果。依赖个体的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。 |
| | | |
| == 分配机制 == | | == 分配机制 == |
− | 分配机制,即分配单位处理的方法,影响平均因果效应的计算。换句话说,当把一个接受治疗的组和一个没有接受治疗的组进行比较时,我们需要知道(或者做出一个假设)为什么某些人被分配到治疗组,而其他人没有。
| + | 分配机制,即给个体分配处理(或者治疗)的方法,影响平均因果效应的计算。换句话说,当把一个接受处理的组和一个没有接受处理的组进行比较时,我们需要知道(或者做出一个假设)为什么某些人被分配到处理组,而其他人没有。 |
| | | |
| 一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。在最简单的情况下,这种分配是随机的(就像在临床试验中一样) ,而且不会混淆,因为分配并不依赖于潜在的结果。 | | 一种分配机制是随机化。对于每个受试者,我们可以抛硬币来确定她是否接受处理。在最简单的情况下,这种分配是随机的(就像在临床试验中一样) ,而且不会混淆,因为分配并不依赖于潜在的结果。 |
第105行: |
第105行: |
| 如果我们希望五个受试者接受处理,我们可以将处理分配给我们从组里里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。 | | 如果我们希望五个受试者接受处理,我们可以将处理分配给我们从组里里挑选出来的前五个名字。当我们随机分配处理时,我们可能会得到不同的答案。 |
| | | |
− | 另一种分配机制是非随机化的,如果所有接受治疗的个体都是因为他们最有可能受益而接受治疗,那么治疗结果和对照组之间的直接比较不能代表治疗的因果效应。
| + | 另一种分配机制是非随机化的,如果所有接受处理的个体都是因为他们最有可能受益而接受处理,那么处理结果和对照组之间的直接比较不能代表处理的因果效应。 |
| | | |
− | 从以下这个例子来理解分配机制,假设这个数据是真实的:
| + | 从以下这个例子来理解分配机制,假设我们同时知道每个个体接受处理和未接受处理的真实潜在结果是什么: |
| {| class="wikitable" align="center" | | {| class="wikitable" align="center" |
| !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) | | !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) |
第122行: |
第122行: |
| |- | | |- |
| !平均||115||123||−8 | | !平均||115||123||−8 |
− | |}真正的平均因果效应是 -8。但是对这些人的因果效应永远不会等于这个平均值。因果效应各不相同,因为它通常(总是未知(?))在现实生活中也是如此。在随机分配处理后,我们可以估计因果效应为: | + | |}可以计算得出真实的平均因果效应是-8。但实际上每个人的因果效应各异,都不会等于这个平均值。而且在现实生活中个体因果效应通常是未知的,因为没办法让一个个体即接受处理又不接受处理,而能同时得到两种情况下的潜在结果。但是在随机分配处理后,我们可以对多个人中接受处理的和未接受处理的潜在结果分别求平均,得到人群的平均因果效应: |
| {| class="wikitable" align="center" | | {| class="wikitable" align="center" |
| !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) | | !主题||Y_{t}(u)||Y_{c}(u)||Y_{t}(u)-Y_{c}(u) |
第139行: |
第139行: |
| |} | | |} |
| | | |
− | | + | 当然,不同的随机分配接受处理个体,产生的平均因果效应的估计值也不同: |
− | 处理的不同随机分配产生对平均因果效应的不同估计。
| |
| {| class="wikitable" align="center" | | {| class="wikitable" align="center" |
| !主题||Y_{t}(u)||Y_{c}(u) | | !主题||Y_{t}(u)||Y_{c}(u) |
第158行: |
第157行: |
| |}平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。 | | |}平均因果效应会有所不同,因为我们的样本很小并且反馈效应的方差很大。如果样本较大且方差较小,则无论随机分配给处理的特定单位如何,平均因果效应将更接近真实的平均因果效应。 |
| | | |
− | 或者,假设该机制将处理分配给所有男性且仅分配给他们。
| + | 以上是随机分配机制的结果。再看一种可能不太合理的分配机制,假设仅将处理分配给所有男性。 |
| {| class="wikitable" align="center" | | {| class="wikitable" align="center" |
| !主题||Y_{t}(u)||Y_{c}(u) | | !主题||Y_{t}(u)||Y_{c}(u) |
第176行: |
第175行: |
| |- | | |- |
| !平均||115||130||−15 | | !平均||115||130||−15 |
− | |}在这种分配机制下,女性不可能接受处理,因此无法确定对女性受试者的平均因果效应。为了对受试者做出因果效应的任何推断,受试者接受治疗的概率必须大于 0 且小于 1。 | + | |}虽然在不区分性别的情况下可以得到一个平均因果效应值,但是在这种分配机制下,因为没有接受处理的女性,所以无法单独对女性受试者确定她们的平均因果效应。此时对女性受试者而言,她们接受处理的概率为0,而为了能对受试者做出因果效应的任何推断,受试者接受处理的概率必须大于 0 且小于 1(Positivity 假设)。 |
| | | |
| == 另见 == | | == 另见 == |