第1行: |
第1行: |
− | ==因果忠实性假设[1]== | + | ==因果忠实性== |
| | | |
| ===定义=== | | ===定义=== |
| | | |
− | 假设某个总体是忠实的,那就是假设其中发生的任何独立性都不是来自不可思议的巧合,而是来自结构。(总体:统计学概念,指包含所研究的全部个体(数据)的集合)
| + | 假设某个总体是忠实的,那就是假设其中发生的任何独立性都不是来自不可思议的巧合,而是来自结构。<ref name="introduction">Scheines R. (1997) [https://pattern.swarma.org/paper?id=72ab907c-c3b0-11eb-a051-0242ac170007 An introduction to causal inference].</ref> |
| + | (总体:统计学概念,指包含所研究的全部个体(数据)的集合) |
| | | |
− | 通过假定因果图满足因果马尔可夫性,我们假设此因果图产生的所有总体都具有通过对其应用d分离而获得的独立性关系。 但是,并不能因此而得出结论,这些总体恰好具有这些独立性关系并且没有其他独立性关系。
| + | 考虑一个分布<math>P_{X}</math>和一个DAG <math>\mathcal{G}</math>. |
| | | |
− | ===示例=== | + | 定义:<math>P_{X}</math>对于DAG <math>\mathcal{G}</math>满足因果忠实性,如果<ref name="Elements">Peters Jonas,Janzing Dominik,Schlkopf Bernhard (2017) [https://pattern.swarma.org/paper?id=5c93b918-c3ba-11eb-8fd5-0242ac170007 Elements of Causal Inference: Foundations and Learning Algorithms].</ref>: |
| | | |
− | [[文件:因果忠实性假设图例1.png|缩略图|图1:运动,吸烟和健康之间的关系]] | + | <math>A \perp\!\!\!\perp B \mid C \Rightarrow A \perp\!\!\!\perp_{\mathcal{G}} B \mid C</math> |
| + | |
| + | 对于所有不相交的顶点集A,B,C均成立。 |
| + | |
| + | 这个定义暗示了一个与全局马尔可夫条件相反的结论: |
| + | |
| + | <math>A \perp\!\!\!\perp_{\mathcal{G}} B \mid C \Rightarrow A \perp\!\!\!\perp B \mid C</math> |
| + | |
| + | 乍一看,忠实性并不是很直观。 我们现在给出一个马尔可夫分布的例子,但对于给定的 DAG <math>\mathcal{G_{1}}</math> 不忠实。 这是通过使两条路径相互抵消并创建图结构未暗示的独立性来实现的。 |
| + | |
| + | ====违反忠实性<ref name="Elements"/>==== |
| + | |
| + | 考虑下图: |
| + | |
| + | <gallery> |
| + | Faithful-3.png |
| + | </gallery> |
| + | |
| + | 我们首先看一个线性高斯 <math>SCM</math> 对应于左图<math>\mathcal{G_{1}}</math>。 |
| + | |
| + | <gallery> |
| + | Faithful-4.png |
| + | </gallery> |
| + | |
| + | 正态分布的噪声变量<math>N_{X} ∼ \mathcal{N} (0,\sigma^2_X )</math>、<math>N_{Y} ∼ \mathcal{N} (0,\sigma^2_Y )</math> 和 <math>N_{Z} ∼ \mathcal{N} (0,\sigma^2_Z )</math> 共同独立。 这是带有图<math>\mathcal{G_{1}}</math> 的线性高斯 <math>SCM</math> 的示例。 现在,如果 |
| + | |
| + | <math>a \cdot b + c = 0</math> (1) |
| + | |
| + | 由于我们获得 <math>X \perp\!\!\!\perp Z</math>,因此分布不忠实于<math>\mathcal{G_{1}}</math>,这不是图结构所暗示的。读者可以轻松验证存在带有DAG <math>\mathcal{G_{2}}</math>的SCM引出相同分布。 |
| + | |
| + | 为了在前面的例子中获得额外的独立性,我们必须“调整”系数,使得两条路径在(1)中相互抵消。 Spirtes等人[2000, Theorem 3.2]对于线性模型表明,如果我们假设系数是从正密度中随机抽取的,那么这种情况发生的概率为零。 |
| + | |
| + | 上例中的分布对于<math>\mathcal{G_{2}}</math>是忠实的,但对于<math>\mathcal{G_{1}}</math>则不是。尽管如此,对于这两个模型,如果没有任何参数归零,则满足因果最小性。换句话说,该分布对于<math>\mathcal{G_{1}}</math> 或<math>\mathcal{G_{2}}</math>的任何真子图都不是马尔可夫的,因为删除任何边将对应于在分布中不成立的新(条件)独立性; 注意<math>\mathcal{G_{2}}</math>不是<math>\mathcal{G_{1}}</math>的真子图。 然而,它是<math>\mathcal{H}</math>的真子图,因此,该分布不满足关于<math>\mathcal{H}</math>的因果最小性。通常,因果最小性弱于忠实性。 |
| + | |
| + | 通过假定因果图满足因果马尔可夫性,我们假设此因果图产生的所有总体都具有通过对其应用d分离而获得的独立性关系。 但是,并不能因此而得出结论,这些总体恰好具有这些独立性关系并且没有其他独立性关系。<ref name="introduction"/> |
| + | |
| + | ===示例<ref name="introduction"/>=== |
| + | |
| + | <gallery> |
| + | 因果忠实性假设图例1.png|运动,吸烟和健康之间的关系 |
| + | </gallery> |
| | | |
| 图1中描述了运动,吸烟和健康之间的关系,其中+和-分别表示正向和抑制性关系。 | | 图1中描述了运动,吸烟和健康之间的关系,其中+和-分别表示正向和抑制性关系。 |
第18行: |
第59行: |
| | | |
| 在这种情况下,我们说总体分布不忠实于产生它的因果图。 | | 在这种情况下,我们说总体分布不忠实于产生它的因果图。 |
− | | + | <noinclude> |
− | ===参考文献===
| + | ==参考文献== |
− | | + | </noinclude> |
− | [1] Scheines, R., 1997. An introduction to causal inference.
| |