无混淆性 Unconfoundedness

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
薄荷讨论 | 贡献2022年6月5日 (日) 11:29的版本
跳到导航 跳到搜索


无混淆性 Unconfoundedness,也被叫做可忽略性 ignorability,由Donald Rubin在1970年代提出[1]。1983年Donald Rubin和Paul Rosenbaum提出了强可忽略分配机制,即给定足够多的基线协变量后潜在结果的联合值与分配独立:

[math]\displaystyle{ (Y(0),Y(1))\perp W|X }[/math]


其中[math]\displaystyle{ Y(0) }[/math][math]\displaystyle{ Y(1) }[/math]是两个潜在结果,W是处理分配,X是协变量[2]。类似地,还有弱可忽略分配机制,只需:[math]\displaystyle{ Y(w)\perp W|X }[/math]

[math]\displaystyle{ w=0和1 }[/math]成立。可忽略性也是缺失数据分析中的常见假设。

定义倾向性得分[math]\displaystyle{ e(x)=P(W=1|X=x) }[/math],用以表示个体被分配到处理组的概率,可以证明,当无混淆性成立时,[math]\displaystyle{ (Y(0),Y(1))\perp W|e(X) }[/math]因此只需要控制一个一维变量,就能实现潜在结果与处理分配相互独立。


无混淆性是因果推断的基础。当无混淆性成立时,平均因果作用可以识别。

[math]\displaystyle{ E[Y(w)]=E\left \{ E[Y(w)|X] \right \}=E\left \{E[Y(w)|X,W=w] \right \}=E\left \{ E[Y|X,W=w] \right \} }[/math]


平均因果作用的估计方法包括逆概率加权、回归、匹配等一系列方法,甚至可以构造双稳健的估计方法,使得只要倾向得分模型或回归模型之一设定正确,就能得到平均因果作用的相合估计。


由于无混淆性涉及潜在结果,因此不可检验。Donald Rubin提出了几种间接验证无混淆性的方法,包括伪结局、伪处理方法,以及基于子集可忽略性的方法[3]。Rosenbaum针对无混淆性提出了敏感性分析[4]


Judea Pearl提出用后门准则来判断无混淆性。在有向无环图中,如果控制一组条件变量,处理变量和结果变量的所有后门路径被阻断,则无混淆性成立。然而实际上基于有向无环图判断无混淆性的做法并不严格。Thomas Richardson和James Robins曾提出单一世界干预图(SWIG),可将处理分配变量、干预值和潜在结果表现在因果图上。在单一世界干预图中,处理分配变量和干预值被阻断,通过检查处理分配变量与潜在结果的后门是否被阻断,可以更严格地判断无混淆性[5]


参考文献

  1. Rubin, Donald (1978). "Bayesian Inference for Causal Effects: The Role of Randomization". The Annals of Statistics
  2. Rubin, Donald B.; Rosenbaum, Paul R. (1983). "The Central Role of the Propensity Score in Observational Studies for Causal Effects"
  3. Imbens & Rubin 2015书
  4. Rosembaum,Design of Observational Studies书
  5. Hernan & Robins,What if书