“忠实性假设”的版本间的差异
(→书籍推荐) |
小 (→编者推荐) |
||
第111行: | 第111行: | ||
− | ----本中文词条由[https://wiki.swarma.org/index.php | + | ----本中文词条由[https://wiki.swarma.org/index.php?title=%E7%94%A8%E6%88%B7:Sikongpop Sikongpop]用户参与编译,[https://wiki.swarma.org/index.php?title=%E7%94%A8%E6%88%B7:LFZ LFZ]参与审校,[https://wiki.swarma.org/index.php?title=%E7%94%A8%E6%88%B7:%E6%80%9D%E6%97%A0%E6%B6%AF%E5%92%BF%E5%91%80%E5%92%BF%E5%91%80 思无涯咿呀咿呀]编辑,欢迎在讨论页面留言。 |
'''本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。''' | '''本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。''' |
2021年7月18日 (日) 00:40的最新版本
在因果发现或贝叶斯网络结构学习中,我们会建立一些假设来保证结构的可识别性,忠实性假设就是其中之一。
因果忠实性
定义
假设某个总体是忠实的,那就是假设其中发生的任何独立性都不是来自不可思议的巧合,而是来自结构。[1] (总体:统计学概念,指包含所研究的全部个体(数据)的集合)
考虑一个多变量联合概率分布[math]\displaystyle{ P_{X} }[/math]和一个有向无环图DAG [math]\displaystyle{ \mathcal{G} }[/math].
定义:联合概率分布 [math]\displaystyle{ P_{X} }[/math] 对于给定的 DAG [math]\displaystyle{ \mathcal{G} }[/math] 满足因果忠实性,如果[2]:
[math]\displaystyle{ A \perp\!\!\!\perp B \mid C \Rightarrow A \perp\!\!\!\perp_{\mathcal{G}} B \mid C }[/math]
对于所有不相交的顶点(变量)集 A,B,C 均成立。
这个定义暗示了一个与全局马尔可夫条件相反的结论:
[math]\displaystyle{ A \perp\!\!\!\perp_{\mathcal{G}} B \mid C \Rightarrow A \perp\!\!\!\perp B \mid C }[/math]
粗略一看,忠实性并不是很直观。 我们现在给出一个马尔可夫分布的例子,但对于给定的 DAG [math]\displaystyle{ \mathcal{G_{1}} }[/math] 不忠实。 这是通过使两条路径相互抵消并创建图结构未暗示的独立性来实现的。
违背忠实性的例子[2]
考虑下图:
我们首先看一个线性高斯 [math]\displaystyle{ SCM }[/math] 对应于左图[math]\displaystyle{ \mathcal{G_{1}} }[/math]。
正态分布的噪声变量[math]\displaystyle{ N_{X} ∼ \mathcal{N} (0,\sigma^2_X ) }[/math]、[math]\displaystyle{ N_{Y} ∼ \mathcal{N} (0,\sigma^2_Y ) }[/math] 和 [math]\displaystyle{ N_{Z} ∼ \mathcal{N} (0,\sigma^2_Z ) }[/math] 共同独立。 这是带有图[math]\displaystyle{ \mathcal{G_{1}} }[/math] 的线性高斯 [math]\displaystyle{ SCM }[/math] 的示例。 现在,如果
[math]\displaystyle{ a \cdot b + c = 0 }[/math] (1)
由于我们获得 [math]\displaystyle{ X \perp\!\!\!\perp Z }[/math],因此分布不忠实于[math]\displaystyle{ \mathcal{G_{1}} }[/math],这不是图结构所暗示的。读者可以轻松验证存在带有DAG [math]\displaystyle{ \mathcal{G_{2}} }[/math]的SCM引出相同分布。
为了在前面的例子中获得额外的独立性,我们必须“调整”系数,使得两条路径在(1)中相互抵消。 Spirtes等人[2000, Theorem 3.2]对于线性模型表明,如果我们假设系数是从正密度中随机抽取的,那么这种情况发生的概率为零。
上例中的分布对于[math]\displaystyle{ \mathcal{G_{2}} }[/math]是忠实的,但对于[math]\displaystyle{ \mathcal{G_{1}} }[/math]则不是。尽管如此,对于这两个模型,如果没有任何参数归零,则满足因果最小性。换句话说,该分布对于[math]\displaystyle{ \mathcal{G_{1}} }[/math] 或[math]\displaystyle{ \mathcal{G_{2}} }[/math]的任何真子图都不是马尔可夫的,因为删除任何边将对应于在分布中不成立的新(条件)独立性; 注意[math]\displaystyle{ \mathcal{G_{2}} }[/math]不是[math]\displaystyle{ \mathcal{G_{1}} }[/math]的真子图。 然而,它是[math]\displaystyle{ \mathcal{H} }[/math]的真子图,因此,该分布不满足关于[math]\displaystyle{ \mathcal{H} }[/math]的因果最小性。通常,因果最小性弱于忠实性。
通过假定因果图满足因果马尔可夫性,我们假设此因果图产生的所有总体都具有通过对其应用d分离而获得的独立性关系。 但是,并不能因此而得出结论,这些总体恰好具有这些独立性关系并且没有其他独立性关系。[1]
示例[1]
图1中描述了运动,吸烟和健康之间的关系,其中+和-分别表示正向和抑制性关系。
在这种结构可能产生的某些分布中,可能存在巧合,如果吸烟对健康有直接的负面影响,但是吸烟对运动有积极的影响(可能看起来很奇怪),而锻炼对健康有积极的影响,那么吸烟可以直接抑制健康并间接改善健康。
如果这两种效应恰好完全平衡并因此抵消,那么吸烟与健康之间可能根本就没有关联。
在这种情况下,我们说总体分布不忠实于产生它的因果图。
参考文献
- ↑ 1.0 1.1 1.2 Scheines R. (1997) An introduction to causal inference.
- ↑ 2.0 2.1 Peters Jonas,Janzing Dominik,Schlkopf Bernhard (2017) Elements of Causal Inference: Foundations and Learning Algorithms.
编者推荐
书籍推荐
- 《Elements of Causal Inference Foundations and Learning Algorithms》是由Bernhard Schölkopf等人所撰写的关于因果科学和机器学习结合的一本书,非常适合想要入门因果机器学习的同学阅读。
关于这本书集智俱乐部邀请白楚研究员用100分钟,为大家详细介绍了Judea Pearl绘制的因果科学蓝图,作为一个起点,去拥抱因果革命。可以查看对应的视频分享解读《为什么》:攀登因果之梯
课程推荐
- 这个视频内容来自集智俱乐部读书会-因果科学与Causal AI读书会第二季内容的分享,由英国剑桥大学及其学习组博士陆超超详细的阐述了潜在结果模型和结果因果模型,并介绍了两个框架的相互转化规律。
- 1. 讲述因果推断的两大框架:潜在结果模型和结构因果模型,讨论他们各自的优缺点以及他们之间的联系,详细介绍他们之间的转化规律。
- 2. 与大家一起深入探讨因果推断中最基本的概念、定理以及它们产生的缘由,了解每个概念背后的故事,从而建立起对因果更全面的感知。
- 3. 分享它们在不同学科中的具体的应用,包括社会科学、经济学、医学、机器学习等,借助这些应用,进一步启发大家用因果科学思维来思考和解决问题。
- 这个视频内容来自集智俱乐部读书会-因果科学与Causal AI读书会第一季内容的分享,这个视频为大家串讲因果推理的相关论文,着眼与因果研究的源头,简单介绍哲学中的因果思考。其次重点是用因果之梯(她的信息视角--回答因果问题需要相应的信息)和一个例子,来理解现代因果建模框架;最后梳理因果推理和 AI 领域的融合,以及Causal AI 的强人工智能之路。
文章总结
因果科学入门读什么书?Y. Bengio博士候选人的研读路径推荐
历时3个月,全球32位讲者,共同讲述因果科学与Causal AI的全景框架!
相关路径
- 因果科学与Casual AI读书会必读参考文献列表,这个是根据读书会中解读的论文,做的一个分类和筛选,方便大家梳理整个框架和内容。
- 因果推断方法概述,这个路径对因果在哲学方面的探讨,以及因果在机器学习方面应用的分析。
- 因果科学和 Causal AI入门路径,这条路径解释了因果科学是什么以及它的发展脉络。此路径将分为三个部分进行展开,第一部分是因果科学的基本定义及其哲学基础,第二部分是统计领域中的因果推断,第三个部分是机器学习中的因果(Causal AI)。
- 复杂网络动力学系统重构文献,这个路径是张江老师梳理了网络动力学重构问题,描述了动力学建模的常用方法和模型,并介绍了一些经典且重要的论文,这也是复杂系统自动建模读书会的主要论文来源,所以大部分都有解读视频。
- 因果纠缠集智年会——因果推荐系统分论坛关于因果推荐系统的参考文献和主要嘉宾介绍,来源是集智俱乐部的因果纠缠年会。
本中文词条由Sikongpop用户参与编译,LFZ参与审校,思无涯咿呀咿呀编辑,欢迎在讨论页面留言。
本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。