因果之梯

此词条由因果科学读书会词条梳理志愿者我是猫（74989）编撰

未经专家审核，带来阅读不便，请见谅。

起源

因果关系对于人类感知和理解世界，采取行动以及理解自己起着核心作用。大约二十年前，计算机科学家 Judea Pearl 通过发现和系统地研究「因果阶梯」（Ladder of Causation），在理解因果关系方面取得了突破，该框架着重说明了观察、做事和想象的独特作用。为了纪念这一具有里程碑意义的发现，人们将其命名为「Pearl 因果层次结构」（Pearl Causal Hierarchy，PCH）。

去年 7 月，来自哥伦比亚大学和斯坦福大学的四位研究者撰写了一篇关于 PCH 和因果推理的技术报告，从逻辑概率和推理图两个方面，对 PCH 进行了新颖全面的解读。

首先介绍了 PCH 是如何从规范的因果机制集合（结构因果模型，SCM）中有机出现的。然后文章转向逻辑层面。该报告的第一个结果是因果层次定理（CHT），该定理表明 PCH 的三个层级从测度论的角度上来看几乎总是分离的。粗略地讲，CHT 表明一层的数据实际上不足以确定较高层的信息。由于在大多数实际情况下，科学家无法获得潜在因果机制的精确形式（只能访问他们生成的关于某些 PCH 层的数据），这促使研究者从图的角度来研究 PCH 内部的推理

具体来说，研究者探索了一组因果推理方法，这些方法可以在给定 SCM 部分规格的情况下，将 PCH 的各层进行桥接，以进行推理。例如，当只有被动观察结果（第一层数据）可用时，你会推断将发生的情况会在环境（第二层语句）中遭到干预。研究者提出了一系列图模型，这些模型让科学家能够以认知上有意义且简约的方式来表示 SCM 的部分规格。

最后，研究者探究了被称为“do算子“（do calculus）的推理系统，展示了在必要情况下，它足以实现 PCH 各层之间的推理。研究者表示：与 PCH 所描绘的人类经验的基本层面相联系是迈向创建下一代 AI 系统的关键一步，该系统将是安全、强大、与人类兼容并符合社会利益的。

定义

图灵曾经提出了图灵测试来进行一个二元分类——人类和非人类。但Pearl是提出了一个三元分类：

第一层级的梯子上站着的是机器人和动物，能够做的就是基于被动观察来做出预测。Pearl认为，目前为止我们的机器学习进展都还是在这一层级的，无论大家认为它有多么强大。

第二层级的梯子上站着的是原始人类和婴儿，它们学会了有意图地去使用工具，对周遭环境进行干预。

第三个层级上的底子上站着的是有较高智慧的人类，拥有反思的能力，能够在大脑中将真实的世界与虚构的世界进行对比。

在这三个层级上，能够提出和解决的问题是不同的：

在第一个层级上，问题都是基于相关性的，比如：“我的肺部有很多焦油沉积，我未来患肺癌的概率是多少？”

而在第二个层级上，就涉及到了对现实世界的干预，并预测干预结果，比如：“我现在已经吸烟三年了，如果我现在戒烟，我还会患肺癌吗？”

第三个层级上，就是要构建一个虚拟世界，并将虚拟世界与现在进行对比，问题的答案就是对比的结果，比如“如果过去的三年我都没有吸烟，现在我还会患肺癌吗？” Pearl在数学上证明了，这三个层级之间是有着根本的区别的。

因果关系之梯是Judea Pearl提出的一种分类法（也可以称为框架），该分类法回答了“因果推理主体可以做什么”这一问题。该问题的另一种表述是——“相较于不具备因果模型的生物，拥有因果模型的生物能推算出什么前者推算不出的东西”。这种分类法的好处在于，它绕过了关于因果论究竟为何物的漫长而徒劳的讨论，聚焦于具体的可回答的问题。

其中因果关系之梯包括三个层级：关联(association)、干预(intervention)和反事实（counterfactual），分别对应逐级复杂的因果问题。下图为因果关系之梯的示意图。

第一层级：关联

在该层级中，主体通过观察寻找规律。这种观察是被动的，不对世界做出干涉，而是通过我们观察到的世界对问题做出回答。关联的例子有：

猫头鹰通过观察老鼠的活动判断老鼠下一刻可能出现的位置
计算机围棋程序通过对数百万棋谱的研究发现胜率高的走法

典型问题：

在关联层级，我们会问的典型问题是“如果我观察到......会怎样？”。

例如，超市经理会问“购买牙膏的顾客同时购买牙线的可能性有多大？”。

回答方法：

统计学可以用于回答这类问题，我们可以利用收集到的历史数据计算P(牙线|牙膏)这一条件概率测算购买牙线和牙膏的关联程度。但是，统计学无法告诉我们事物之间的因果关系。

第二层级：干预

干预涉及到主体对现状的主动改变，根据可以被观察到的世界回答问题。

典型问题：

“如果我们实施......行动，将会怎样？” 例如：“如果我们把牙膏的价格翻倍，牙线的销售额将会怎样？”
“怎么做？” 例如：“我们应当如何定价以卖掉仓库里积压的牙膏？”

回答方法：

进行严格控制条件下的实验，例如网站通过AB test判断用户对页面颜色的偏好
建立因果模型（DAG），结合数据进行预测

第三层级：反事实

数据顾名思义就是事实，数据无法告诉我们在反事实或虚构的世界里会发生什么。在反事实世界里，观察到的事实被直截了当地否定了。然而，人类的思维却能可靠地、重复地进行这种寻求背后解释的推断。...... 这种能力彻底地区分了人类智能与动物智能，以及人类与模型盲版本的人工智能和机器学习。

我们通过一个情景来理解反事实:

假设乔在服用了药物D一个月后死亡，那么我们要关注的问题就是这种药物是否导致了他的死亡。为了回答这个问题，我们需要想象这样一种情况：假如乔在即将服药时改变了主意，他现在会活着吗？

在反事实层级，我们需要回答与一个无法被观察的世界相关的问题。

典型问题：

“假如我当时做了......会怎样？” 例如：“假如我们把牙膏的价格提高一倍，则之前买了牙膏的顾客仍然选择购买的概率是多少？”
“为什么？”

回答方法：

第二层级中的干预实验无法回答反事实问题，因为我们无法对过去的事实进行改变。

通过结构因果模型（SCM），我们可以回答反事实问题。

样例理解

为了更好的理解因果之梯得三层架构，我们可以通过Judea Pearl著作中所提的一个例子来理解三个层级概念。

假设要将一个犯人进行枪决，需要经过下述流程：

首先，需要法院发布处决犯人的命令
行刑队队长收到法院命令后，对士兵A和士兵B发布处决指令
士兵A或士兵B接到命令开枪

我们假设士兵A和B只听队长的命令开枪，不会擅自开枪。此外，只要任一枪手开枪，犯人都会死亡。

请考虑以下问题：

不考虑自然死亡的情况，如果犯人死了，那么这是否意味着法院已下令处决犯人？
假设我们发现士兵A射击了，它告诉了我们关于B的什么信息？
如果士兵A决定按自己的意愿射击，而不等待队长的命令，情况会怎样？犯人会不会死？
假设犯人现在已倒地身亡，从这一点我们可以得出结论：A射击了，B射击了，行刑队队长发出了指令，法院下了判决。但是，假如A决定不开枪，犯人是否还活着？

上述问题中，1和2为关联层级的问题（一个事实告诉我们有关另一事实的什么信息），我们可以通过观察到的情况“犯人已死”、“士兵A射击”做出推理回答问题，得到法院下令和士兵B也射击了的回答。

3为干预层级的问题，我们需要对现实世界做出调整（现实：士兵A只听队长命令，调整：士兵A按照自己的意愿射击），从而根据可以被观察到的世界回答问题。

4为反事实层级的问题。在现实世界中，A已经开枪了，但我们需要了解另一个与现实相矛盾的世界（A没有开枪，其它情况不变）中犯人的情况。对于该问题，我们无法根据观察到的世界回答，也无法对现在的世界进行干涉从而回答该问题。但是，我们可以通过构建因果模型从而推理出问题的回答。

因果之梯

目录

起源

定义

第一层级：关联

第二层级：干预

第三层级：反事实

样例理解

推荐资料

导航菜单

搜索