后门准则
为何需要后门准则
在因果图中,我们往往需要估计变量[math]\displaystyle{ X }[/math]对另一个变量[math]\displaystyle{ Y }[/math]的因果效应,而因果图结构往往非常复杂,后门准则是用来快速估计因果图中的变量[math]\displaystyle{ X }[/math]对另一个变量[math]\displaystyle{ Y }[/math]的因果效应的判断准则,是因果推断中使用非常广泛的准则。
后门准则定义
给定有向无环图中的一对有序变量[math]\displaystyle{ (X,Y) }[/math],如果变量集合Z满足:Z中没有X的后代节点,且Z阻断了X与Y之间的每条含有指向X的路径,则称Z满足关于(X,Y)的后门准则。
如果变量集合Z满足(X,Y)的后门准则,那么X对Y的因果效应可以由以下公式计算 [math]\displaystyle{ P(Y=y|do(X=x)) = \sum_zP(Y=y|X=x, Z=z)P(Z=z) }[/math]
后门准则背后逻辑
当试图寻找X对Y的因果效应时,后门准则主要有两个目的:
- 阻断任何含有指向[math]\displaystyle{ X }[/math]的后门路径/伪路径;
- 确保现有所有从变量[math]\displaystyle{ X }[/math]到变量[math]\displaystyle{ Y }[/math]的路径不变。
为了确保第一个目的,条件节点集合不能包含变量[math]\displaystyle{ X }[/math]的后代节点,因为在进行评估[math]\displaystyle{ X }[/math]对变量[math]\displaystyle{ Y }[/math]的因果效应时,会对变量[math]\displaystyle{ X }[/math]采取干预,继而影响变量[math]\displaystyle{ X }[/math]的后代节点,从而影响变量[math]\displaystyle{ Y }[/math],但以[math]\displaystyle{ X }[/math]的后代节点为条件会阻断这些路径。
为了确保第二个目的,我们需要阻断所有一切伪路径以及条件节点集合中引入的新的伪路径。 寻找一个条件节点集合使得能阻断任何含有指向X的后门路径(指可能使得X和Y相关但并不传递X产生的因果效应),因为如果不阻断这些后门路径,它们会混淆X对Y的效应。
后门准则实例
X:新药;Y:痊愈率;W:体重;Z:经济社会地位