链接合,叉接合,对撞接合

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
我是猫讨论 | 贡献2022年6月5日 (日) 10:26的版本
跳到导航 跳到搜索

此词条由因果科学读书会词条梳理志愿者我是猫(74989)编撰,未经专家审核,带来阅读不便,请见谅。

参考链接https://zhuanlan.zhihu.com/p/109932832 补充中文文本2500以上

定义

接合(junction)是包含两个连接的三节点网络,是所有贝叶斯网络及因果网络的构建模块。接合有三种基本形式:链接合、叉接合、对撞接合

贝叶斯网络

贝叶斯网络的基本结构是一个有向无环图(Directed Acyclic Graph, DAG),由节点(nodes)和节点之间带有单向箭头的连线组成。贝叶斯网络的基础就是通过这三种基础结构形成的。

链接合

第一种结构链接合(也被称为head-to-tail),顾名思义,像一条链子一样,让信息从一端流到另一端。链结合是最简单的接合表现形式。在科学中,人们常常将B视为某种机制,或“中介物”,它将A的效应传递给C。

例:“火灾→烟雾→警报”

链接合

在链结合中,中介物B“屏蔽”(screen off)了从A到C的信息或从C到A的信息。例如,一旦我们知道了烟雾的“值”,关于火的任何新信息便不会再以任何理由让我们增强或削弱对警报的信念。

换句话说,信息从A经过B流向C,因此A和C是相关的(即不是独立的)。考虑一个更复杂的链结构:A->C->D->E->B  ,虽然变长了,但是信息还是能够从A流向B,因此A和B仍然是相关的。

叉接合

第二种结构叉接合(也被称为tail-to-tail),旁边两个边类似一条路的分叉,信息从中间结点传输到两端。在叉接合中,B通常被视作A和C的共因(common cause)或混杂因子(confounder)。混杂因子会使A和C在统计学上发生关联,即使它们之间并没有直接的因果关系。

例:“鞋的尺码←孩子的年龄→阅读能力”

叉接合

穿较大码的鞋的孩子往往阅读能力较强。但这种关系是非因果的——给孩子穿大一号的鞋不会让他有更强的阅读能力,相反,这两个变量的变化都可以通过第三个变量,即孩子的年龄来解释。越年长的孩子鞋码越大,他们的阅读能力也越强。

对于叉接合,信息从B流向A,也从B流向C,那么A和C就不是独立的。考虑一个更复杂的叉结构:A<-C<-D<-E->G->B  ,信息从E流向A,也流向B,那么A和B就不是独立的。

对撞接合

最重要的是第三种,反叉式,也叫对撞接合(也被称为head-to-head),像两个对撞的小行星一样,信息流入中间的节点。当以变量B为条件时,对撞接合与链接合或叉接合的运作方式正好相反。如果A和C原本是相互独立的,那么给定B将使它们彼此相关。

对撞接合

例:才华→名人←美貌

若只选著名演员的数据,那么我们就会看到才华与美貌之间出现了负相关,这种负相关可以解释为:发现某位名人并不美貌这一事实,会使我们更相信他富有才华。这种负相关有时被称为对撞偏倚或“辩解”效应(explain-away effect)

对于对撞接合,信息从A和C分别流向B,并且在B对撞。所以B也被称为对撞子(collider)。此时,A和C都影响B,但是信息没有从B流向A或者C,因此A和C是相互独立的。

更一般地,如果一条从A到B的路径中出现了对撞接合,那么A和B就不可能是相关的(至少针对这条路径而言,如果有别的路径那再另说)。所以,对于路径A->C<-D<-B  ,信息分别从 A 和 B流入  ,并在此对撞。因此A和B仍然是不相关或者说相互独立的。

接合关系与信息流动

因果模型通过三种接合连接起来,构成了系统信息的传输,对于模型上信息的传输可以直观理解为:将连接看作一个管道,管道将信息从X点传递到Y点。其中信息的传递是双向的,既在因果方向传递,也在非因果方向传递,其中重要的是控制非因果路径,容易造成混杂,影响结论。

如何阻断信息在接合中的流动:

a. 链接和(A→B→C):控制B可防止有关A的信息流向C或C的信息流向A

b. 叉接合(A←B→C):控制B可以防止有关A的信息流向C或C的信息流向A

c. 对撞接合(A→B←C):控制B后由于辩解效应的存在,信息会在“管道”中流通