“前门调整”的版本间的差异

来自集智百科
跳到导航 跳到搜索
第28行: 第28行:
 
[[文件:吸烟与肺癌.png|缩略图|吸烟与肺癌。S=smoking=吸烟,T=Tar=焦油,C=cancer=肺癌,G=gene=基因。我们需要估计吸烟对肺癌的因果效应。]]
 
[[文件:吸烟与肺癌.png|缩略图|吸烟与肺癌。S=smoking=吸烟,T=Tar=焦油,C=cancer=肺癌,G=gene=基因。我们需要估计吸烟对肺癌的因果效应。]]
 
[[文件:吸烟肺癌数据.png|缩略图|吸烟、焦油、肺癌数据。]]
 
[[文件:吸烟肺癌数据.png|缩略图|吸烟、焦油、肺癌数据。]]
 +
{| class="wikitable"
 +
|+吸烟、焦油、肺癌数据
 +
!
 +
!组别
 +
!P(x,z) (每个组别所占百分比)
 +
!<nowiki>P(Y=1|x,z) (每组内罹患癌症的百分比)</nowiki>
 +
|-
 +
!X=0,Z=0
 +
!非吸烟者,肺内无焦油
 +
!47.5
 +
!10
 +
|-
 +
!X=1,Z=0
 +
!吸烟者,肺内无焦油
 +
!2.5
 +
!90
 +
|-
 +
!X=0,Z=1
 +
!非吸烟者,肺内有焦油
 +
!2.5
 +
!5
 +
|-
 +
!X=1,Z=1
 +
!吸烟者,肺内有焦油
 +
!47.5
 +
!85
 +
|}
 +
从数据中来看,似乎吸烟对肺癌有显著影响,但是烟草公司会从不同的角度争辩,从而给出不同的答案。
 +
 
<references />
 
<references />

2021年7月23日 (五) 23:20的版本

调整目的: 因果效应估计

我们期望在给定如下因果图的情况下,判断治疗变量 T 对结果变量 Y 的因果效应 [math]\displaystyle{ P(y|do(t)) }[/math],其中 W 是一个未观测的混淆变量,M 是中介变量。(注意:我们现在观测不到W,无法进行后门调整.。)

前门调整


主要步骤如下[1]

  1. 估计T对M的因果效应[math]\displaystyle{ P(m|do(t)) }[/math] ,由于T-W-Y-M 这条路径被 阻断 (见 D-分离) [math]\displaystyle{ P(m|do(t))=P(m|t) }[/math].
  2. 估计M对Y的因果效应[math]\displaystyle{ P(y|do(m)) }[/math], 由于 T 阻断了后门路径 M<-T<-W ->Y, 根据后门调整 我们可以轻松得到[math]\displaystyle{ P(y|do(m))= \sum_t P(y|m,t) P(t) }[/math].
  3. 结合以上两种因果效应[math]\displaystyle{ P(y|do(t))= \sum_m P(y|do(m)) P(m| do(t)) }[/math].

前门准则[2]

定义:我们说变量集 M 关于 T 和 Y 满足前门准则,若:

  1. M 完全中介了 T 和 Y,即所有从T到Y的因果路径都经过M。
  2. 从 T 到 M 没有未被阻断的后门路径
  3. 所有从M到Y的后门路径被 T阻断。

前门调整

若变量集M关于(T,Y)满足前门准则,并且我们有[math]\displaystyle{ P(t,m)\gt 0 }[/math], T对Y的因果效应是可识别的,

[math]\displaystyle{ P(y|do(t))= \sum_m P(m| t) \sum_{t'} P(y|m,t') P(t') }[/math].

例子:吸烟与肺癌

吸烟与肺癌。S=smoking=吸烟,T=Tar=焦油,C=cancer=肺癌,G=gene=基因。我们需要估计吸烟对肺癌的因果效应。
吸烟、焦油、肺癌数据。
吸烟、焦油、肺癌数据
组别 P(x,z) (每个组别所占百分比) P(Y=1|x,z) (每组内罹患癌症的百分比)
X=0,Z=0 非吸烟者,肺内无焦油 47.5 10
X=1,Z=0 吸烟者,肺内无焦油 2.5 90
X=0,Z=1 非吸烟者,肺内有焦油 2.5 5
X=1,Z=1 吸烟者,肺内有焦油 47.5 85

从数据中来看,似乎吸烟对肺癌有显著影响,但是烟草公司会从不同的角度争辩,从而给出不同的答案。

  1. https://www.bradyneal.com/Introduction_to_Causal_Inference-Dec17_2020-Neal.pdf
  2. Pearl, Judea. "Models, reasoning and inference." Cambridge, UK: CambridgeUniversityPress 19 (2000).