“前门调整”的版本间的差异

2021年7月23日 (五) 23:31的版本

我们期望在给定如下因果图的情况下，判断治疗变量 T 对结果变量 Y 的因果效应 [math]\displaystyle{ P(y|do(t)) }[/math]，其中 W 是一个未观测的混淆变量，M 是中介变量。（注意：我们现在观测不到W，无法进行后门调整.。）

前门调整

主要步骤如下^[1]：

估计T对M的因果效应[math]\displaystyle{ P(m|do(t)) }[/math] ，由于T-W-Y-M 这条路径被阻断（见 D-分离) [math]\displaystyle{ P(m|do(t))=P(m|t) }[/math].
估计M对Y的因果效应[math]\displaystyle{ P(y|do(m)) }[/math], 由于 T 阻断了后门路径 M<-T<-W ->Y, 根据后门调整我们可以轻松得到[math]\displaystyle{ P(y|do(m))= \sum_t P(y|m,t) P(t) }[/math].
结合以上两种因果效应[math]\displaystyle{ P(y|do(t))= \sum_m P(y|do(m)) P(m| do(t)) }[/math].

定义：我们说变量集 M 关于 T 和 Y 满足前门准则，若：

若变量集M关于（T,Y）满足前门准则，并且我们有[math]\displaystyle{ P(t,m)\gt 0 }[/math], T对Y的因果效应是可识别的，

[math]\displaystyle{ P(y|do(t))= \sum_m P(m| t) \sum_{t'} P(y|m,t') P(t') }[/math].

吸烟与肺癌。S=smoking=吸烟（对应表中X），T=Tar=焦油（对应表中Z），C=cancer=肺癌（对应表中Y），G=gene=基因。我们需要估计吸烟对肺癌的因果效应。

吸烟、焦油、肺癌数据。

从数据中来看，似乎吸烟对肺癌有显著影响，但是烟草公司会从不同的角度争辩，从而给出不同的答案。若我们只看非吸烟者，体内有焦油可以的患癌率从10%降到了5%；若们只看吸烟者，体内有焦油可以的患癌率从90%降到了85%，可见焦油有防护作用。

数学上，前门调整可以被运用,

[math]\displaystyle{ P(Y=1|do(X=0))= 0.4975,P(Y=1|do(X=1))= 0.4525, }[/math]。

↑ https://www.bradyneal.com/Introduction_to_Causal_Inference-Dec17_2020-Neal.pdf
↑ Pearl, Judea. "Models, reasoning and inference." Cambridge, UK: CambridgeUniversityPress 19 (2000).

@@ 第58行： / 第58行： @@
-数学上，前门调整可以被运用。
+数学上，前门调整可以被运用,
+<math> P(Y=1|do(X=0))= 0.4975,P(Y=1|do(X=1))= 0.4525, </math>。