后门准则

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
Janeway讨论 | 贡献2021年7月26日 (一) 14:51的版本
跳到导航 跳到搜索

为何需要后门准则

在因果图中,我们往往需要估计变量[math]\displaystyle{ X }[/math]对另一个变量[math]\displaystyle{ Y }[/math]的因果效应,而因果图结构往往非常复杂,后门准则是用来快速估计因果图中的变量[math]\displaystyle{ X }[/math]对另一个变量[math]\displaystyle{ Y }[/math]的因果效应的判断准则,是因果推断中使用非常广泛的准则。

后门准则定义

给定有向无环图中的一对有序变量[math]\displaystyle{ (X,Y) }[/math],如果变量集合Z满足:Z中没有X的后代节点,且Z阻断了X与Y之间的每条含有指向X的路径,则称Z满足关于(X,Y)的后门准则。

如果变量集合Z满足(X,Y)的后门准则,那么X对Y的因果效应可以由以下公式计算 [math]\displaystyle{ P(Y=y|do(X=x)) = \sum_zP(Y=y|X=x, Z=z)P(Z=z) }[/math]

后门准则背后逻辑

当试图寻找X对Y的因果效应时,后门准则主要有两个目的:

  1. 阻断任何含有指向[math]\displaystyle{ X }[/math]的后门路径/伪路径;
  2. 确保现有所有从变量[math]\displaystyle{ X }[/math]到变量[math]\displaystyle{ Y }[/math]的路径不变。

注意,伪路径是指连接[math]\displaystyle{ X }[/math][math]\displaystyle{ Y }[/math],并指向[math]\displaystyle{ X }[/math]的有向路径,与期望的指向[math]\displaystyle{ Y }[/math]路径相反。

为了确保第一个目的,条件节点集合不能包含变量[math]\displaystyle{ X }[/math]的后代节点,因为在进行评估[math]\displaystyle{ X }[/math]对变量[math]\displaystyle{ Y }[/math]的因果效应时,会对变量[math]\displaystyle{ X }[/math]采取干预,继而影响变量[math]\displaystyle{ X }[/math]的后代节点,从而影响变量[math]\displaystyle{ Y }[/math],但以[math]\displaystyle{ X }[/math]的后代节点为条件会阻断这些路径。

为了确保第二个目的,我们需要阻断所有一切伪路径以及条件节点集合中引入的新的伪路径。 寻找一个条件节点集合使得能阻断任何含有指向X的后门路径(指可能使得X和Y相关但并不传递X产生的因果效应),因为如果不阻断这些后门路径,它们会混淆X对Y的效应。

后门准则实例

01.png

图1:X:新药;Y:痊愈率;W:体重;Z:经济社会地位

在图1的因果图中,我们搜索满足从X到Y后门准则的观察变量,可以发现,节点W(非X的后代)阻断了指向X的后门路路径X\leftarrow Z \rightarrow W \rightarrow Y,但没有创造新的后门路径或者改变从X到Y的有向路径,因此节点W满足后门准则,因此,只要校正W就能得到X到Y的因果效应,即

[math]\displaystyle{ P(Y=y|do(X=x)) = \sum_wP(Y=y|X=x, W=w)P(W=w) }[/math]

在寻找满足后门准则的节点集合时,需要特别关注对撞节点。