结构因果模型

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
Sikongpop讨论 | 贡献2021年5月27日 (四) 02:17的版本
跳到导航 跳到搜索

此词条暂由彩云小译翻译,翻译字数共X,未经人工整理和审校,带来阅读不便,请见谅。

模板:Cleanup rewrite

比较两个竞争的因果模型(DCM,GCM)用于解释fMRI 图像[1]

在科学哲学中,因果模型(或结构因果模型)是描述系统因果机制的概念模型。因果模型可以通过提供清晰的规则来决定需要考虑/控制哪些自变量,从而改进研究设计。

它们可以从现有的观察数据中回答一些问题,而无需进行随机对照试验似的干预性研究。一些干预性研究由于伦理或实践的原因是不合适的,这意味着如果没有一个因果模型,一些假设无法被检验。

因果模型可以帮助解决外部有效性问题(一项研究的结果是否适用于未研究的总体)。因果模型可以允许多个研究的数据(在某些情况下)合并来回答任何单个数据集都无法回答的问题。

因果模型是可证伪的,因为如果它们与数据不匹配,它们就必须作为无效模型而被拒绝。它们还必须使得接触模型所要解释现象的群体信赖它们。

因果模型在信号处理、流行病学和机器学习中都有应用。


定义

Causal models are mathematical models representing causal relationships within an individual system or population. They facilitate inferences about causal relationships from statistical data. They can teach us a good deal about the epistemology of causation, and about the relationship between causation and probability. They have also been applied to topics of interest to philosophers, such as the logic of counterfactuals, decision theory, and the analysis of actual causation.[2]

Judea Pearl 将因果模型定义为一个有序的三元组[math]\displaystyle{ \langle U, V, E\rangle }[/math] ,其中 U 是一组外生变量,其值由模型外部的因素决定; V 是一组内生变量,其值由模型内部的因素决定; E 是一组结构方程,把每个内生变量的值表示为 U 和 V 中其他变量值的函数。

历史

亚里士多德定义了因果关系的分类法,包括质料因、形式因、动力因、目的因。休谟更偏爱反事实,他拒绝了亚里士多德的分类法。有段时间,他否认物体本身具有使得一个物体成为原因而另一个物体成为结果的“力量”。后来,他接受了“第一物体还没存在时,第二个根本不存在”的观点(“but-for”因果关系)。

19世纪末,统计学学科开始形成。经过多年努力确定诸如生物遗传等领域的因果规则后,高尔顿引入了均值回归的概念(以二年生症候群为缩影),后来这将他引向了非因果的相关性概念。

作为一个实证主义者,皮尔逊将因果的概念从许多科学中去除,他认为因果关系是一种无法证明的特殊的关联,并引入相关系数作为关联强度的度量方法。他写道: “作为运动原因的力,与作为成长原因的树神完全一样”,而因果关系只是“现代科学高深奥秘中的迷信”。皮尔逊在伦敦大学学院创立了“Biometrika”和生物识别实验室,该实验室成为了统计领域的全球领导者。

1908年,Hardy和Weinberg通过重拾孟德尔遗传律,解决了导致高尔顿放弃因果关系的性状稳定问题。

1921年,Wright的路径分析成为因果模型和因果图的理论雏形。他开发了这种路径分析方法,试图同时阐明遗传、发育和环境对豚鼠皮毛模式的相对影响。他通过展示这样的分析如何解释豚鼠出生体重、子宫内时间和产仔数之间的关系来支持他旁门左道的观点。杰出的统计学家对这些想法的反对使因果关系在接下来的40年中被忽略(除了动物饲养员)。取而代之的是,科学家依赖于相关性, partly at the behest of Wright's critic (and leading statistician), Fisher。唯一的例外是一名叫Burks的学生,在1926年首先应用路径图来表示中介影响,并断言保持中介变量恒定会引起误差。她可能独立地发明了路径图。

1923年,Neyman提出了潜在结果(potential outcome)的概念,但是直到1990年他的论文才从波兰语被翻译成英语。

1958年,Cox警告说,控制一个变量Z仅在Z高概率不受到自变量影响的情况下才有效。

19世纪60年代,Duncan、Blalock、Goldberger等人重新发现了路径分析。Duncan在阅读Blalock关于路径图的著作时,想起了二十年前Ogburn的一次演讲,其中提到了Wright的论文,而后又提到了Burks。

社会学家最初将因果模型称为结构方程模型,但一旦它成为教条式方法就失去了效用,导致一些从业者拒绝与因果关系的任何联系。经济学家采用了路径分析的代数部分,称其为联立方程建模。但是,经济学家仍然避免将因果含义赋予他们的方程式。

Wright在发表第一篇论文60年后,根据Karlin等人的批评,发表了一篇概述该论文的文章,该论文反对仅处理线性关系,而鲁棒的、非模型的数据表示方式则更具揭示性。

1973年,Lewis提倡用but-for因果关系(反事实)代替相关性。他提到了 humans' ability to envision alternative worlds in which a cause did or not occur and in which effect an appeared only following its cause 。1974年Rubin引入了“潜在结果”(potential outcome)的概念,作为询问因果问题的语言。

1983年,Cartwright提出any factor that is "causally relevant" to an effect be conditioned on, moving beyond simple probability as the only guide

1986年,Baron和Kenny引入了检测和评估线性方程系统中的中介的原理。截至2014年,他们的论文在所有时间中被引用次数排在第33位。那年,Greenland和Robins通过考虑反事实,引入了“可交换性”方法,来处理混杂问题。他们提出评估如果治疗组没有接受治疗会给治疗组带来什么后果,并将其结果与对照组进行比较。如果结果一致,说明没有混杂因子。

哥伦比亚大学设有因果人工智能实验室,该实验室正试图将因果建模理论与人工神经网络联系起来。

因果关系之梯

Pearl的因果元模型涉及三个层次的抽象,他称之为因果之梯。最低层的“关联”(看到/观察)需要感知输入数据中的规律性或模式,用相关性表示。中间层的“干预”(做)可以预测有意识行动的后果,用因果关系表示。最高层的“反事实”(想象)涉及构建部分世界的理论,该理论解释为什么特定行为会产生特定后果,以及在没有此行为的情况下会发生什么。

关联

如果观察一个对象改变了观察另一个对象的可能性,则这个对象与另一个对象相关联。例子:购买牙膏的购物者也更有可能购买牙线。数学上用

[math]\displaystyle{ P (牙线 | 牙膏) }[/math]

表示已知一个人购买牙膏时的其购买牙线的可能性。关联也可以通过计算两个事件的相关性来测量。关联没有因果含义。一个事件可能导致另一个事件,反过来也可能,或者两个事件都可能由某个第三事件引起(卫生学家使得购物者购买牙线和牙膏)。

干预

该层涉及事件之间的特定因果关系。因果是通过实验性地执行影响事件的一些动作来评估。例子:如果我们将牙膏的价格提高一倍,那么人们购买牙线的概率将是多少?因果无法通过检验(价格变化)历史来确定,因为可能存在其他因素同时影响这两个变量,比如存在牙膏价格变化的其他原因,而且这种原因会影响牙线的价格(两种商品的关税增加)。数学上用

[math]\displaystyle{ P (牙线 | do(牙膏)) }[/math]

表示这种概率。其中do是一个算子,表示对谁做实验性干预(如价格翻倍)。这个算子指示了要在创造所需效果的世界中进行最小的变化,即在现实模型上进行尽可能小的改变的“小手术”。

反事实

最高层的反事实涉及对过去事件的其他可能版本的考虑,或者考虑同一实验单位中在不同情况下会发生的情况。例如,如果当初那家商店的牙线价格翻了一番,那么当时那些购买牙膏的购物者仍然会购买牙线的可能性是多少?

[math]\displaystyle{ P (牙线 | 牙膏, 牙线价格翻倍) }[/math]

反事实可以表明存在因果关系。可以回答反事实的模型允许进行精确的后果可以预测的干预。在极致情况下,这样的模型被作为物理定律(如若不将力施加到静止物体上物体将不会移动的惯性)。

因果

因果和关联

统计学设计分析多个变量之间的关系。传统上,这些关系被描述为相关性,即没有任何隐含因果关系的关联。因果模型试图通过添加因果关系的概念来扩展此框架,在因果关系中,一个变量的变化导致其他变量的变化。

二十世纪因果的定义完全依赖于概率/关联。一个事件 X 如果增加了另一个事件 Y 的可能性,则认为它会导致另一个事件。在数学上,这表示为:

[math]\displaystyle{ P (Y | X) \gt P(Y) }[/math]

这样的定义是不充分的,因为可能有其他关系(例如,X和Y的常见原因)可以满足该条件。因果与因果之梯的第二层有关。关联处于第一层,仅向第二层提供证据。

之后的定义试图通过以背景因素为条件来解决这种歧义。数学上:

[math]\displaystyle{ P (Y | X, K = k) \gt P(Y| K = k) }[/math]

其中K是背景变量的集合,k表示特定语境中背景变量的值。但是,所需的背景变量集是难以确定的。

定义因果的其他尝试包括格兰杰因果,这是一种统计假设检验,在经济学中可以通过测量用一个时间序列的过去值预测另一个时间序列的未来值的能力来评估序列间的因果。

类型

原因可以是必要的、充分的、部分的以及它们的组合。

必要因

对于 y 的必要因 x ,y的存在意味着 x在此前发生了。但是x的存在不意味着y会发生。必要因也被称为“若非”因,因为y不会发生若非 x 发生。

充分因

对于y的充分因x,x的存在意味着y接下来会发生。然而另一个原因z也可能独立地造成y的发生。即y的发生不要求x的发生。

部分因

对于y的部分因x,x的存在会增加y的似然。如果似然是100%,那么x就是充分的。部分因也是必要的。

模型

因果图

因果图是一个有向图,它显示了因果模型中变量间的因果关系。因果图包括一组变量(或节点)。每个节点通过箭头连接到一个或多个对其具有因果效应的其他节点。箭头描绘了因果的方向,例如,将变量A和B与位于B处的箭头相连的箭头表示A的变化导致B的变化(以某种概率)。一条路径是两个节点间沿着因果箭头的图的遍历。

因果图包括因果环图,有向无环图和鱼骨图。

因果图和它们的定量概率无关。对这些概率的更改(例如,由于技术改进)不需要更改因果图。

模型元素

因果模型具有形式结构,其元素具有特定的属性。

结点模式

三个节点的连接类型有三种,分别是线性链式,分支叉式和合并对撞式。[5]

链是直线连接,箭头指向因果关系。在这个模型中,B是中介者,因为它可以中介A否则会对C所做的更改。

[math]\displaystyle{ A -\gt B -\gt C }[/math]

在叉中,一个原因有多种结果。这两种结果有一个共同的原因。A和C之间存在(非因果的)虚假相关性,可以通过把B作为条件(选取B的特定值)来消除虚假相关性。

[math]\displaystyle{ A \lt - B -\gt C }[/math]

“把B作为条件”是指“给定B”(即B取某个值)。 某些情况下叉是混杂因子:

[math]\displaystyle{ A \lt - B -\gt C -\gt A }[/math]

在这样的模型中,B是A和C的共同原因(C也是A的原因),这使B成为混杂因子。

对撞因子

在对撞模式中,多种原因会影响一种结果。以B为条件(B取特定值)通常会揭示A与C之间的非因果的负相关。这种负相关被称为对撞偏差和“解释性”效应,即B解释了A与C之间的相关性。该相关性在A和C两者都是影响B的必要因时是正的。

[math]\displaystyle{ A -\gt B \lt - C }[/math]

节点类型

中介变量

中介节点修改了其他原因对结果的影响(与原因简单地影响结果不同)。例如,在上面的链结构中,B是中介变量,因为它修改了A(C的间接原因)对C(结果)的影响。

混杂因子

混杂节点影响多个结果,从而在它们之间产生正相关。

工具变量

满足如下条件的是工具变量: (1)有通往结果的路径 (2)没有通往其他因果变量的路径 (3)对结果没有直接影响 回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。

例如,给定模型:

[math]\displaystyle{ Z -\gt X -\gt Y \lt - U -\gt X }[/math]

Z是一种工具变量,因为它有一条通往结果Y的路径,并且不受U的混杂。

孟德尔随机化

定义:孟德尔随机化使用已知功能的基因来观察研究中可改变的部分对疾病的因果关系。

由于基因在人群中随机变化,因此基因的存在通常可以视为工具变量,这意味着在许多情况下,可以使用观察性研究中的回归来量化因果关系。

Category:Causal diagrams

类别: 因果图表


Category:Causality

分类: 因果关系


Category:Formal epistemology

范畴: 形式认识论


Category:Scientific modeling

类别: 科学建模


This page was moved from wikipedia:en:Causal model. Its edit history can be viewed at 结构因果模型/edithistory

  1. Karl Friston (Feb 2009). "Causal Modelling and Brain Connectivity in Functional Magnetic Resonance Imaging". PLOS Biology. 7 (2): e1000033. doi:10.1371/journal.pbio.1000033. PMC 2642881. PMID 19226186.
  2. Hitchcock, Christopher (2018), "Causal Models", in Zalta, Edward N. (ed.), The Stanford Encyclopedia of Philosophy (Fall 2018 ed.), Metaphysics Research Lab, Stanford University, retrieved 2018-09-08