更改

第18行: 第18行:  
== 链接合 ==
 
== 链接合 ==
 
第一种结构为链式结构/链接合(也被称为head-to-tail),顾名思义,像一条链子一样,让信息从一端流到另一端。链结合是最简单的接合表现形式。在科学中,人们常常将B视为某种机制,或“中介物”,它将A的效应传递给C。链式结构中的链式与数学中常用的链式法则的链式有着接近相同的含义,指代着因果关系的层层递进,即A为B的因,B又为C的因,每一层的节点(或者说中介物)又屏蔽它的上层和下层;人类是很容易的依靠条件独立性,依靠与生俱来的筛选能力或者推断能力,确定相关信息和无关信息的界限,但是机器并没有这种能力,为机器配置这种因果图是推动机器学习更加鲁棒,更加智能不可或缺的必经之路。
 
第一种结构为链式结构/链接合(也被称为head-to-tail),顾名思义,像一条链子一样,让信息从一端流到另一端。链结合是最简单的接合表现形式。在科学中,人们常常将B视为某种机制,或“中介物”,它将A的效应传递给C。链式结构中的链式与数学中常用的链式法则的链式有着接近相同的含义,指代着因果关系的层层递进,即A为B的因,B又为C的因,每一层的节点(或者说中介物)又屏蔽它的上层和下层;人类是很容易的依靠条件独立性,依靠与生俱来的筛选能力或者推断能力,确定相关信息和无关信息的界限,但是机器并没有这种能力,为机器配置这种因果图是推动机器学习更加鲁棒,更加智能不可或缺的必经之路。
 +
 +
'''规则1 (链结构中的条件独立性)'''
 +
 +
如果变量X和Y之间只有一条单向路径,Z是截断这条路径的任何一组变量,则在Z的条件下,X和Y是独立的。
    
例:“火灾→烟雾→警报”
 
例:“火灾→烟雾→警报”
第28行: 第32行:  
== 叉接合 ==
 
== 叉接合 ==
 
第二种结构为叉式结构/叉接合(也被称为tail-to-tail),旁边两个边类似一条路的分叉,信息从中间结点传输到两端。在叉接合中,B通常被视作A和C的共因(common cause)或混杂因子(confounder)。混杂因子会使A和C在统计学上发生关联,即使它们之间并没有直接的因果关系。[[文件:叉接合.png|缩略图|叉接合]]
 
第二种结构为叉式结构/叉接合(也被称为tail-to-tail),旁边两个边类似一条路的分叉,信息从中间结点传输到两端。在叉接合中,B通常被视作A和C的共因(common cause)或混杂因子(confounder)。混杂因子会使A和C在统计学上发生关联,即使它们之间并没有直接的因果关系。[[文件:叉接合.png|缩略图|叉接合]]
 +
'''规则2 (分叉结构的条件独立性)'''
 +
 +
如果变量X是变量Y和Z的共同原因,并且Y和Z之间只有一条路径,则Y和Z在X的条件下独立。
 +
 
直接观察图中的叉式结构的形状的话与叉子还有一定的差距,不过因果图中(或者说接合模块)在乎的是不同节点的拓扑关系,将中间节点向上或者向下移动之后就可以看出一个明显的叉子形状,这里中间节点B通常被视为A和C的共因(common cause)或混杂因子(confounder )。混杂因子会使A和C在统计学上发生关联,即使它们没有直接的关系,在pearl的the book of why 中举了一个非常经典例子:“鞋的尺码←孩子的年龄→阅读能力”,穿较大码的鞋的孩子年龄可能更大,所以往往有着更强的阅读能力,但当固定了年龄之后,A和C就条件独立了。换句话说,穿较大码的鞋的孩子往往阅读能力较强。但这种关系是非因果的——给孩子穿大一号的鞋不会让他有更强的阅读能力,相反,这两个变量的变化都可以通过第三个变量,即孩子的年龄来解释。越年长的孩子鞋码越大,他们的阅读能力也越强。
 
直接观察图中的叉式结构的形状的话与叉子还有一定的差距,不过因果图中(或者说接合模块)在乎的是不同节点的拓扑关系,将中间节点向上或者向下移动之后就可以看出一个明显的叉子形状,这里中间节点B通常被视为A和C的共因(common cause)或混杂因子(confounder )。混杂因子会使A和C在统计学上发生关联,即使它们没有直接的关系,在pearl的the book of why 中举了一个非常经典例子:“鞋的尺码←孩子的年龄→阅读能力”,穿较大码的鞋的孩子年龄可能更大,所以往往有着更强的阅读能力,但当固定了年龄之后,A和C就条件独立了。换句话说,穿较大码的鞋的孩子往往阅读能力较强。但这种关系是非因果的——给孩子穿大一号的鞋不会让他有更强的阅读能力,相反,这两个变量的变化都可以通过第三个变量,即孩子的年龄来解释。越年长的孩子鞋码越大,他们的阅读能力也越强。
   第35行: 第43行:  
最重要的是第三种,对撞式/反叉式结构,也叫对撞接合(也被称为head-to-head),像两个对撞的小行星一样,信息流入中间的节点。当以变量B为条件时,对撞接合与链接合或叉接合的运作方式正好相反。如果A和C原本是相互独立的,那么给定B将使它们彼此相关。进一步说,根据拓扑学中形式即内容的理念,当我们以中间变量B为条件时(即为某个变量遍历各个指定的值),这种对撞接合的运作方式与叉接合,链接合的运作方式又有所不同,给定B即固定了链接合和叉接合的某一节点的原因,导致A和C至少有一节点固定,从而阻断它们的相关性,而在对撞中给定B则为固定了它们的结果,导致对A和C采取了有偏选取,打乱了随机分布,从而因为两种分布的有偏呈现了一定程度的相关性。
 
最重要的是第三种,对撞式/反叉式结构,也叫对撞接合(也被称为head-to-head),像两个对撞的小行星一样,信息流入中间的节点。当以变量B为条件时,对撞接合与链接合或叉接合的运作方式正好相反。如果A和C原本是相互独立的,那么给定B将使它们彼此相关。进一步说,根据拓扑学中形式即内容的理念,当我们以中间变量B为条件时(即为某个变量遍历各个指定的值),这种对撞接合的运作方式与叉接合,链接合的运作方式又有所不同,给定B即固定了链接合和叉接合的某一节点的原因,导致A和C至少有一节点固定,从而阻断它们的相关性,而在对撞中给定B则为固定了它们的结果,导致对A和C采取了有偏选取,打乱了随机分布,从而因为两种分布的有偏呈现了一定程度的相关性。
 
[[文件:对撞接合.png|缩略图|对撞接合]]
 
[[文件:对撞接合.png|缩略图|对撞接合]]
 +
'''规则3 (对撞结构中的条件独立性)'''
 +
 +
如果变量Z是变量X和Y之间的对撞节点,并且X和Y之间只有一条路径,那么X和Y就是无条件独立的,但是在Z和Z的任何子孙条件下是相互依赖的。
 +
 
例:才华→名人←美貌
 
例:才华→名人←美貌
  
316

个编辑