第1行: |
第1行: |
| === 为何需要后门准则 === | | === 为何需要后门准则 === |
− | 在因果图中,我们往往需要估计变量<math>X</math>对另一个变量<math>Y</math>的因果效应,而因果图结构往往非常复杂,后门准则是用来快速估计因果图中的变量<math>X</math>对另一个变量<math>Y</math>的因果效应的判断准则,是因果推断中使用非常广泛的准则。
| + | 在结构因果图中,我们往往需要估计变量<math>X</math>对另一个变量<math>Y</math>的因果效应,而因果图结构也随着节点数量增加变得非常复杂。针对因果效应评估问题,后门准则能快速根据图结构估计变量<math>X</math>对变量<math>Y</math>的因果效应,是因果推断中使用非常广泛的基础准则之一。 |
| | | |
| === 后门准则定义 === | | === 后门准则定义 === |
− |
| |
| 给定有向无环图中的一对有序变量<math>(X,Y)</math>,如果变量集合<math>Z</math>满足:<math>Z</math>中没有<math>X</math>的后代节点,且<math>Z</math>阻断了<math>X</math>与<math>Y</math>之间的每条含有指向<math>X</math>的路径,则称<math>Z</math>满足关于<math>(X,Y)</math>的后门准则。 | | 给定有向无环图中的一对有序变量<math>(X,Y)</math>,如果变量集合<math>Z</math>满足:<math>Z</math>中没有<math>X</math>的后代节点,且<math>Z</math>阻断了<math>X</math>与<math>Y</math>之间的每条含有指向<math>X</math>的路径,则称<math>Z</math>满足关于<math>(X,Y)</math>的后门准则。 |
| | | |
− | 如果变量集合<math>Z</math>满足<math>(X,Y)</math>的后门准则,那么X对Y的因果效应可以对变量<math>Z</math>的校正得到,即对<math>Z</math>进行求和,具体表现如下: | + | 如果变量集合<math>Z</math>满足<math>(X,Y)</math>的后门准则,那么<math>X</math>对<math>Y</math>的因果效应可以对变量集<math>Z</math>的校正得到,即对<math>Z</math>进行求和,具体表现如下: |
| <math> | | <math> |
| P(Y=y|do(X=x)) = \sum_zP(Y=y|X=x, Z=z)P(Z=z) | | P(Y=y|do(X=x)) = \sum_zP(Y=y|X=x, Z=z)P(Z=z) |
第13行: |
第12行: |
| === 后门准则背后逻辑 === | | === 后门准则背后逻辑 === |
| | | |
− | 当试图寻找<math>X</math>对<math>Y</math>的因果效应时,后门准则主要有两个目的:
| + | 当试图寻找变量集合<math>Z</math>来估计<math>X</math>对<math>Y</math>的因果效应时,寻找一个条件节点集合<math>Z</math>使得能阻断任何含有指向<math>X</math>的后门路径(指可能使得<math>X</math>和<math>Y</math>相关但并不传递X产生的因果效应),因为如果不阻断这些后门路径,它们会混淆<math>X</math>对<math>Y</math>的效应。后门准则包含两个方面的路径检查: |
| | | |
− | # 阻断任何含有指向<math>X</math>的后门路径/伪路径; | + | # 阻断任何变量<math>X</math>到变量<math>Y</math>的后门路径/伪路径(伪路径是指不同于从变量<math>X</math>指向变量<math>Y</math>有向路径的所有其他路径); |
| # 确保现在所有从变量<math>X</math>到变量<math>Y</math>的路径不变。 | | # 确保现在所有从变量<math>X</math>到变量<math>Y</math>的路径不变。 |
| | | |
− | 注意,伪路径是指与期望的从变量<math>X</math>指向变量<math>Y</math>路径不同的所有其他路径。
| + | 第一个检查是为了确保条件节点集合不能包含变量<math>X</math>的后代节点,因为在进行评估<math>X</math>对变量<math>Y</math>的因果效应时,会对变量<math>X</math>采取干预,继而影响变量<math>X</math>的后代节点,从而影响变量<math>Y</math>,但以<math>X</math>的后代节点为条件会阻断这些路径。 |
− | | |
− | 为了确保第一个目的,条件节点集合不能包含变量<math>X</math>的后代节点,因为在进行评估<math>X</math>对变量<math>Y</math>的因果效应时,会对变量<math>X</math>采取干预,继而影响变量<math>X</math>的后代节点,从而影响变量<math>Y</math>,但以<math>X</math>的后代节点为条件会阻断这些路径。
| |
| | | |
− | 为了确保第二个目的,我们需要阻断所有一切伪路径以及条件节点集合中引入的新的伪路径。
| + | 第二个检查是为了阻断所有一切伪路径以及条件节点集合引入的新伪路径。 |
− | 寻找一个条件节点集合使得能阻断任何含有指向<math>X</math>的后门路径(指可能使得<math>X</math>和<math>Y</math>相关但并不传递X产生的因果效应),因为如果不阻断这些后门路径,它们会混淆<math>X</math>对<math>Y</math>的效应。
| |
| | | |
| === 后门准则实例 === | | === 后门准则实例 === |