前门调整

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
Kuang讨论 | 贡献2021年7月23日 (五) 23:08的版本 →‎例子
跳到导航 跳到搜索

调整目的: 因果效应估计

我们期望在给定如下因果图的情况下,判断治疗变量 T 对结果变量 Y 的因果效应 [math]\displaystyle{ P(y|do(t)) }[/math],其中 W 是一个未观测的混淆变量,M 是中介变量。(注意:我们现在观测不到W,无法进行后门调整.。)

前门调整


主要步骤如下[1]

  1. 估计T对M的因果效应[math]\displaystyle{ P(m|do(t)) }[/math] ,由于T-W-Y-M 这条路径被 阻断 (见 D-分离) [math]\displaystyle{ P(m|do(t))=P(m|t) }[/math].
  2. 估计M对Y的因果效应[math]\displaystyle{ P(y|do(m)) }[/math], 由于 T 阻断了后门路径 M<-T<-W ->Y, 根据后门调整 我们可以轻松得到[math]\displaystyle{ P(y|do(m))= \sum_t P(y|m,t) P(t) }[/math].
  3. 结合以上两种因果效应[math]\displaystyle{ P(y|do(t))= \sum_m P(y|do(m)) P(m| do(t)) }[/math].

前门准则[2]

定义:我们说变量集 M 关于 T 和 Y 满足前门准则,若:

  1. M 完全中介了 T 和 Y,即所有从T到Y的因果路径都经过M。
  2. 从 T 到 M 没有未被阻断的后门路径
  3. 所有从M到Y的后门路径被 T阻断。

前门调整

若变量集M关于(T,Y)满足前门准则,并且我们有[math]\displaystyle{ P(t,m)\gt 0 }[/math], T对Y的因果效应是可识别的,

[math]\displaystyle{ P(y|do(t))= \sum_m P(m| t) \sum_{t'} P(y|m,t') P(t') }[/math].

例子:吸烟与肺癌

吸烟与肺癌。S=smoking=吸烟,T=Tar=焦油,C=cancer=肺癌,G=gene=基因。我们需要估计吸烟对肺癌的因果效应。
吸烟、焦油、肺癌数据。
  1. https://www.bradyneal.com/Introduction_to_Causal_Inference-Dec17_2020-Neal.pdf
  2. Pearl, Judea. "Models, reasoning and inference." Cambridge, UK: CambridgeUniversityPress 19 (2000).