Do演算

Do演算 Do-Calculus于1995年由Judea Pearl提出^[1]，是由三条推演规则构成的推演系统，这三条规则可以将包含干预变量和观测变量的概率分布表达式进行转化。Do演算属于因果科学中结构因果模型的基础分析工具，可用于非参数模型中因果效应的识别，并能够在中介分析 Mediation Analysis、知识迁移 Transportability、元综合Metasynthesis等方向上发挥重要作用。

为何需要Do演算

一个无法使用后门调整和前门调整的因果图

在处理一部分因果图时，可以使用后门调整后门调整和前门调整等技术进行统计调整，这样可以根据不涉及Do算子的数据来估算干预的效果。然而我们无法根据前门准则和后门准则事先确定一个给定的因果模型是否适用于这样的统计调整方式。后门调整和前门调整方法也无法处理所有可识别的模型，例如右侧的因果图是可识别的，但既无法使用后门调整也无法使用前门调整。

而Do演算是一个具有完备性的推演系统，可以处理所有可识别的模型，当然也就包括了右侧图中这个例子。同时，利用Do演算还有一系列的计算机算法，可以自动、高速地去判断一个模型的可识别性，并在可识别的模型中将包含Do算子的概率分布表达式转换为仅包含观测变量的概率分布表达式。

Do演算规则集

在以下规则的表述中，使用符号[math]\displaystyle{ G_{\overline{X}} }[/math]表示删除有向图[math]\displaystyle{ G }[/math]中所有指向结点[math]\displaystyle{ X }[/math]的边后得到的子图，使用符号[math]\displaystyle{ G_{\overline{X}\underline{Z}} }[/math]表示删除有向图[math]\displaystyle{ G }[/math]中所有指向结点[math]\displaystyle{ X }[/math]的边和从结点[math]\displaystyle{ Z }[/math]指出的边后得到的子图。

规则一

增添或删除观察：

对于有向图[math]\displaystyle{ G }[/math]，若满足[math]\displaystyle{ (Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}}} }[/math]（即在子图[math]\displaystyle{ G_{\overline{X}} }[/math]中，给定结点集[math]\displaystyle{ X }[/math]和[math]\displaystyle{ W }[/math]时，结点集[math]\displaystyle{ Y }[/math]和[math]\displaystyle{ Z }[/math]满足d-分离条件），则

[math]\displaystyle{ P(Y|do(X),Z,W)=P(Y|do(X),W) }[/math]

规则二

交换干预和观察：

对于有向图[math]\displaystyle{ G }[/math]，若满足[math]\displaystyle{ (Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}\underline{Z}}} }[/math]（即在子图[math]\displaystyle{ G_{\overline{X}\underline{Z}} }[/math]中，给定结点集[math]\displaystyle{ X }[/math]和[math]\displaystyle{ W }[/math]时，结点集[math]\displaystyle{ Y }[/math]和[math]\displaystyle{ Z }[/math]满足d-分离条件），则

[math]\displaystyle{ P(Y|do(X),do(Z),W)=P(Y|do(X),Z,W) }[/math]

规则三

增添或删除干预：

对于有向图[math]\displaystyle{ G }[/math]，若满足[math]\displaystyle{ (Y \perp\!\!\!\perp Z \mid X, W)_{G_{\overline{X}\overline{Z(W)}}} }[/math]（即在子图[math]\displaystyle{ G_{\overline{X}\overline{Z(W)}} }[/math]中，给定结点集[math]\displaystyle{ X }[/math]和[math]\displaystyle{ W }[/math]时，结点集[math]\displaystyle{ Y }[/math]和[math]\displaystyle{ Z }[/math]满足d-分离条件），则

[math]\displaystyle{ P(Y|do(X),do(Z),W)=P(Y|do(X),W) }[/math]

其中符号[math]\displaystyle{ Z(W) }[/math] 表示 [math]\displaystyle{ Z / An(W)_{ G_{ \overline{X} } } }[/math] ，而符号[math]\displaystyle{ An(W)_{ G_{ \overline{X} } } }[/math] 表示在子图[math]\displaystyle{ G_{ \overline{X}} }[/math]中由结点集[math]\displaystyle{ W }[/math]及其祖先节点构成的点集。

Do演算的完备性

定理

[math]\displaystyle{ Q = P(y \mid do(x),z) }[/math] 是可识别的，当且仅当它可以被Do演算的三条规则转化为一个不包含Do算子的表达式。

证明

要证明上述定理的正确性，需要分别证明Do演算的可靠性(Soundness)和充分性(Sufficiency)。其中可靠性的证明由Judea Pearl于1995年给出^[1]，充分性的证明由Yimin Huang和Marco Valtorta于2006年给出^[2]。

应用案例

应用案例1

Do演算的案例1

在右侧的因果图中，“吸烟基因”是未观测变量，其余变量都是可观测的。“吸烟”变量使用[math]\displaystyle{ s }[/math]来表示，“焦油沉积”变量使用[math]\displaystyle{ t }[/math]来表示，“癌症”变量使用[math]\displaystyle{ c }[/math]来表示。我们要估计干预“吸烟”变量后对“癌症”变量的因果效应，即计算[math]\displaystyle{ P(c \mid do(s)) }[/math]。我们将使用Do演算将这个表达式转换为不包含Do算子的表达式。 [math]\displaystyle{ \begin{alignat}{3} P(c \mid do(s)) & = \Sigma_t P(c \mid do(s), t)P(t \mid do(s)) & \text{（使用概率公理）} \\ & = \Sigma_t P(c \mid do(s), do(t))P(t \mid do(s)) & \text{（使用规则二）} \\ & = \Sigma_t P(c \mid do(s), do(t))P(t \mid s) & \text{（使用规则二）} \\ & = \Sigma_t P(c \mid do(t))P(t \mid s) & \text{（使用规则三）} \\ & = \Sigma_{s'}\Sigma_t P(c \mid do(t),s')P(s' \mid do(t))P(t \mid s) & \text{（使用概率公理）} \\ & = \Sigma_{s'}\Sigma_t P(c \mid t,s')P(s' \mid do(t))P(t \mid s) & \text{（使用规则二）} \\ & = \Sigma_{s'}\Sigma_t P(c \mid t,s')P(s')P(t \mid s) & \text{（使用规则三）} \end{alignat} }[/math]

应用案例2

Do演算的案例2 - 间接混杂

此案例由Nanny Wermuth和D. R. Cox给出^[3]，对应的实际例子可参见论文内容。其中治疗方案1（X）是随机施于患者的，而治疗方案2（Z）是根据治疗方案1所导致的中期结果（W）而制定的，在这里要计算的是干预两种治疗方案后对最终结果的因果效应，即[math]\displaystyle{ P(y \mid do(x), do(z)) }[/math]。可以再次使用Do演算将这个表达式转换为不包含Do算子的表达式。

[math]\displaystyle{ \begin{alignat}{3} P(y \mid do(x), do(z)) & = P(y \mid x, do(z)) & \text{（由于X是随机的）} \\ & = \Sigma_w P(y \mid x, w, do(z))P(w \mid x, do(z)) & \text{（使用规则一）} \\ & = \Sigma_w P(y \mid x, w, z)P(w \mid x, z) & \text{（使用规则二、三）} \end{alignat} }[/math]

代码实现

Ananke

Ananke框架基于Python语言实现，集成了ID算法，详细内容可见Ananke开源地址

causaleffect

causaleffect框架基于R语言实现，集成了ID算法和IDC算法，详细内容可见causaleffect包信息地址

CEE

CEE框架基于Golang语言实现，集成了ID算法、IDC算法、Identify算法等，详细内容可见CEE开源地址

参考文献

↑ ^1.0 ^1.1 Pearl, Judea (1995), "Causal diagrams for empirical research", Biometrika, 82 (4): 669–710, doi:10.1093/biomet/82.4.669.
↑ Huang, Yimin; Valtorta, Marco (2006). "Pearl's Calculus of Intervention is Complete". Proceedings of the Twenty-Second Conference on Uncertainty in Artificial Intelligence: 217–224.
↑ Wermuth, Nanny; Cox, D. R. (2008). "Distortion of Effects Caused by Indirect Confounding". Biometrika. 95: 17–33.
↑ Tian, Jin; Pearl, Judea (2002). "A General Identification Condition for Causal Effects". Eighteenth National Conference on Artificial Intelligence: 567–573.
↑ Huang, Yimin; Valtorta, Marco (2006). "Identifiability in Causal Bayesian Networks: A Sound and Complete Algorithm". Proceedings of the 21st National Conference on Artificial Intelligence. 2: 1149–1154.
↑ Shpitser, Ilya; Pearl, Judea (2006). "Identification of Joint Interventional Distributions in Recursive Semi-Markovian Causal Models". Proceedings of the 21st National Conference on Artificial Intelligence. 2: 1219–1226.
↑ Shpitser, Ilya; Pearl, Judea (2006). "Identification of Conditional Interventional Distributions". Proceedings of the Twenty-Second Conference on Uncertainty in Artificial Intelligence: 437–444.

编辑推荐

书籍推荐

《统计因果推理入门》封面

统计因果推理入门对应英文Causal Inference in Statistics: A Primer

这本书非常适合初学者入门因果科学，这里面涉及到对结构因果模型的详细定义和阐述，非常清晰易懂。

为什么-关于因果的新科学

《为什么-关于因果关系的新科学》封面

在本书中，人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾，厘清了知识的本质，确立了因果关系研究在科学探索中的核心地位。

关于这本书集智俱乐部邀请白楚研究员用100分钟，为大家详细介绍了Judea Pearl绘制的因果科学蓝图，作为一个起点，去拥抱因果革命。可以查看对应的视频分享解读《为什么》：攀登因果之梯

课程推荐

两套因果框架深度剖析：潜在结果模型与结构因果模型

这个视频内容来自集智俱乐部读书会-因果科学与Causal AI读书会第二季内容的分享，由英国剑桥大学及其学习组博士陆超超详细的阐述了潜在结果模型和结果因果模型，并介绍了两个框架的相互转化规律。

1. 讲述因果推断的两大框架：潜在结果模型和结构因果模型，讨论他们各自的优缺点以及他们之间的联系，详细介绍他们之间的转化规律。

2. 与大家一起深入探讨因果推断中最基本的概念、定理以及它们产生的缘由，了解每个概念背后的故事，从而建立起对因果更全面的感知。

3. 分享它们在不同学科中的具体的应用，包括社会科学、经济学、医学、机器学习等，借助这些应用，进一步启发大家用因果科学思维来思考和解决问题。

如何用信息视角理解现代因果模型框架？

这个视频内容来自集智俱乐部读书会-因果科学与Causal AI读书会第一季内容的分享，这个视频为大家串讲因果推理的相关论文，着眼与因果研究的源头，简单介绍哲学中的因果思考。其次重点是用因果之梯（她的信息视角--回答因果问题需要相应的信息）和一个例子，来理解现代因果建模框架；最后梳理因果推理和 AI 领域的融合，以及Causal AI 的强人工智能之路。