无混淆性 Unconfoundedness

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
是趣木木呀讨论 | 贡献2022年4月17日 (日) 22:02的版本
跳到导航 跳到搜索

无混淆性也被叫做可忽略性(ignorability),由Donald Rubin在1970年代提出[i]。1983年Donald Rubin和Paul Rosenbaum提出了强可忽略分配机制,即给定足够多的基线协变量后潜在结果的联合值与分配独立,,其中和是两个潜在结果,是处理分配,是协变量[ii]。类似地,还有弱可忽略分配机制,只需对和1成立。可忽略性也是缺失数据分析中的常见假设。


定义倾向性得分,用以表示个体被分配到处理组的概率,可以证明,当无混淆性成立时,,因此只需要控制一个一维变量,就能实现潜在结果与处理分配相互独立。


无混淆性是因果推断的基础。当无混淆性成立时,平均因果作用可以识别。平均因果作用的估计方法包括逆概率加权、回归、匹配等一系列方法,甚至可以构造双稳健的估计方法。


由于无混淆性涉及潜在结果,因此不可检验。Donald Rubin提出了几种间接验证无混淆性的方法,包括伪结局、伪处理方法,以及基于子集可忽略性的方法[iii]。Rosenbaum针对无混淆性提出了敏感性分析[iv]。


Judea Pearl提出用后门准则来判断无混淆性。在有向无环图中,如果控制一组条件变量,处理变量和结果变量的所有后门路径被阻断,则无混淆性成立。然而实际上基于有向无环图判断无混淆性的做法并不严格。Thomas Richardson和James Robins曾提出单一世界干预图(SWIG),可将处理分配变量、干预值和潜在结果表现在因果图上。在单一世界干预图中,处理分配变量和干预值被阻断,通过检查处理分配变量与潜在结果的后门是否被阻断,可以更严格地判断无混淆性[v]。


[i] Rubin, Donald (1978). "Bayesian Inference for Causal Effects: The Role of Randomization". The Annals of Statistics

[ii] Rubin, Donald B.; Rosenbaum, Paul R. (1983). "The Central Role of the Propensity Score in Observational Studies for Causal Effects"

[iii] Imbens & Rubin 2015书

[iv] Rosembaum,Design of Observational Studies书

[v] Hernan & Robins,What if书