更改

跳到导航 跳到搜索
添加507字节 、 2021年6月4日 (五) 09:24
无编辑摘要
第13行: 第13行:       −
== 定义 ==
+
== 定义 Definition ==
    
<blockquote>Causal models are mathematical models representing causal relationships within an individual system or population. They facilitate inferences about causal relationships from statistical data. They can teach us a good deal about the epistemology of causation, and about the relationship between causation and probability. They have also been applied to topics of interest to philosophers, such as the logic of counterfactuals, decision theory, and the analysis of actual causation.<ref>{{Citation|last=Hitchcock|first=Christopher|title=Causal Models|date=2018|url=https://plato.stanford.edu/archives/fall2018/entries/causal-models/|encyclopedia=The Stanford Encyclopedia of Philosophy|editor-last=Zalta|editor-first=Edward N.|edition=Fall 2018|publisher=Metaphysics Research Lab, Stanford University|access-date=2018-09-08}}</ref></blockquote>
 
<blockquote>Causal models are mathematical models representing causal relationships within an individual system or population. They facilitate inferences about causal relationships from statistical data. They can teach us a good deal about the epistemology of causation, and about the relationship between causation and probability. They have also been applied to topics of interest to philosophers, such as the logic of counterfactuals, decision theory, and the analysis of actual causation.<ref>{{Citation|last=Hitchcock|first=Christopher|title=Causal Models|date=2018|url=https://plato.stanford.edu/archives/fall2018/entries/causal-models/|encyclopedia=The Stanford Encyclopedia of Philosophy|editor-last=Zalta|editor-first=Edward N.|edition=Fall 2018|publisher=Metaphysics Research Lab, Stanford University|access-date=2018-09-08}}</ref></blockquote>
第19行: 第19行:  
Judea Pearl将因果模型定义为一个有序的三元组<math>\langle U, V, E\rangle</math>,其中 U 是一组外生变量,其值由模型外部的因素决定;V 是一组内生变量,其值由模型内部的因素决定;E 是一组结构方程,把每个内生变量的值表示为 U 和 V 中其他变量值的函数。
 
Judea Pearl将因果模型定义为一个有序的三元组<math>\langle U, V, E\rangle</math>,其中 U 是一组外生变量,其值由模型外部的因素决定;V 是一组内生变量,其值由模型内部的因素决定;E 是一组结构方程,把每个内生变量的值表示为 U 和 V 中其他变量值的函数。
   −
== 历史 ==
+
== 历史 History ==
    
亚里士多德定义了因果关系的分类法,包括质料因、形式因、动力因、目的因。休谟更偏爱反事实,他拒绝了亚里士多德的分类法。有段时间,他否认物体本身具有使得一个物体成为原因而另一个物体成为结果的“力量”。后来,他接受了“如果第一物体还没存在,第二个根本不存在”的观点(“but-for”因果关系)。
 
亚里士多德定义了因果关系的分类法,包括质料因、形式因、动力因、目的因。休谟更偏爱反事实,他拒绝了亚里士多德的分类法。有段时间,他否认物体本身具有使得一个物体成为原因而另一个物体成为结果的“力量”。后来,他接受了“如果第一物体还没存在,第二个根本不存在”的观点(“but-for”因果关系)。
第49行: 第49行:  
哥伦比亚大学设有因果人工智能实验室,该实验室正试图将因果建模理论与人工神经网络联系起来。
 
哥伦比亚大学设有因果人工智能实验室,该实验室正试图将因果建模理论与人工神经网络联系起来。
   −
== 因果关系之梯 ==
+
== 因果关系之梯 Ladder of Causation ==
    
Judea Pearl的因果元模型涉及三个层次的抽象,他称之为因果之梯。最低层的“关联”(看到/观察)需要感知输入数据中的规律性或模式,用相关性表示。中间层的“干预”(做)可以预测有意识行动的后果,用因果关系表示。最高层的“反事实”(想象)涉及构建部分世界的理论,该理论解释为什么特定行为会产生特定后果,以及在没有此行为的情况下会发生什么。
 
Judea Pearl的因果元模型涉及三个层次的抽象,他称之为因果之梯。最低层的“关联”(看到/观察)需要感知输入数据中的规律性或模式,用相关性表示。中间层的“干预”(做)可以预测有意识行动的后果,用因果关系表示。最高层的“反事实”(想象)涉及构建部分世界的理论,该理论解释为什么特定行为会产生特定后果,以及在没有此行为的情况下会发生什么。
   −
=== 关联 ===
+
=== 关联 Association ===
    
如果观察一个对象改变了观察另一个对象的可能性,则这个对象与另一个对象相关联。例子:购买牙膏的购物者也更有可能购买牙线。数学上用
 
如果观察一个对象改变了观察另一个对象的可能性,则这个对象与另一个对象相关联。例子:购买牙膏的购物者也更有可能购买牙线。数学上用
第59行: 第59行:  
表示已知一个人购买牙膏时的其购买牙线的可能性。关联也可以通过计算两个事件的相关性来衡量。关联并不意味着因果。一个事件可能导致另一个事件,反过来也可能,或者两个事件都可能由某个第三事件引起(牙医对口腔健康的宣传使得购物者同时购买牙线和牙膏)。
 
表示已知一个人购买牙膏时的其购买牙线的可能性。关联也可以通过计算两个事件的相关性来衡量。关联并不意味着因果。一个事件可能导致另一个事件,反过来也可能,或者两个事件都可能由某个第三事件引起(牙医对口腔健康的宣传使得购物者同时购买牙线和牙膏)。
   −
=== 干预 ===
+
=== 干预 Intervention ===
    
该层涉及事件之间的特定因果关系。因果是通过实验性地执行影响事件的一些动作来评估。例如:如果我们将牙膏的价格提高一倍,那么人们购买牙线的概率将是多少?因果无法通过检验历史信息来确定,因为可能存在其他因素同时影响这两个变量,比如存在牙膏价格变化的其他原因,而且这种原因会影响牙线的价格(例如两种商品的关税增加)。数学上用
 
该层涉及事件之间的特定因果关系。因果是通过实验性地执行影响事件的一些动作来评估。例如:如果我们将牙膏的价格提高一倍,那么人们购买牙线的概率将是多少?因果无法通过检验历史信息来确定,因为可能存在其他因素同时影响这两个变量,比如存在牙膏价格变化的其他原因,而且这种原因会影响牙线的价格(例如两种商品的关税增加)。数学上用
第65行: 第65行:  
表示这种概率。其中do是一个算子,表示对谁做实验性干预(如价格翻倍)。这个算子指示了要在创造所需效果的世界中进行最小的变化,即在现实模型上进行尽可能小的改变的“小手术”。
 
表示这种概率。其中do是一个算子,表示对谁做实验性干预(如价格翻倍)。这个算子指示了要在创造所需效果的世界中进行最小的变化,即在现实模型上进行尽可能小的改变的“小手术”。
   −
=== 反事实 ===
+
=== 反事实 Counterfactuals ===
    
最高层的反事实涉及对过去事件的其他可能版本的考虑,或者考虑同一实验个体中在不同情况下会发生的情况。例如,如果当初那家商店的牙线价格翻了一番,那么当时那些购买牙膏的购物者仍然会购买牙线的可能性是多少?
 
最高层的反事实涉及对过去事件的其他可能版本的考虑,或者考虑同一实验个体中在不同情况下会发生的情况。例如,如果当初那家商店的牙线价格翻了一番,那么当时那些购买牙膏的购物者仍然会购买牙线的可能性是多少?
第73行: 第73行:  
反事实可以表明存在因果关系。回答反事实的模型允许进行精确的干预,这些干预的后果可被预测。在极端情况下,这样的模型被人们认为是物理定律(如惯性:若不将力施加到静止物体上物体将不会移动)。
 
反事实可以表明存在因果关系。回答反事实的模型允许进行精确的干预,这些干预的后果可被预测。在极端情况下,这样的模型被人们认为是物理定律(如惯性:若不将力施加到静止物体上物体将不会移动)。
   −
== 因果 ==
+
== 因果 Causality ==
   −
=== 因果和关联 ===
+
=== 因果和关联 Causality vs Correlation ===
    
统计学涉及分析多个变量之间的关系。传统上,这些关系被描述为相关性,即没有任何隐含因果关系的关联。因果模型试图通过添加因果关系的概念来扩展此框架,在因果关系中,一个变量的变化导致其他变量的变化。
 
统计学涉及分析多个变量之间的关系。传统上,这些关系被描述为相关性,即没有任何隐含因果关系的关联。因果模型试图通过添加因果关系的概念来扩展此框架,在因果关系中,一个变量的变化导致其他变量的变化。
第91行: 第91行:  
定义因果的其他尝试包括'''<font color="#ff8000"> 格兰杰因果 Granger Causality </font>''',这是一种统计假设检验,在经济学中,可以通过衡量用一个时间序列的过去值预测另一个时间序列的未来值的能力,来评估序列间的因果。
 
定义因果的其他尝试包括'''<font color="#ff8000"> 格兰杰因果 Granger Causality </font>''',这是一种统计假设检验,在经济学中,可以通过衡量用一个时间序列的过去值预测另一个时间序列的未来值的能力,来评估序列间的因果。
   −
=== 类型 ===
+
=== 类型 Types ===
    
原因可以是必要的、充分的、部分的以及它们的组合。
 
原因可以是必要的、充分的、部分的以及它们的组合。
   −
==== 必要因 ====
+
==== 必要因 Necessary Causes ====
 
对于 y 的必要因 x ,y 的存在意味着 x 在此前发生了。但是 x 的存在不意味着y会发生。必要因也被称为“若非(but-for)”因,即y不会发生若非 x 发生。
 
对于 y 的必要因 x ,y 的存在意味着 x 在此前发生了。但是 x 的存在不意味着y会发生。必要因也被称为“若非(but-for)”因,即y不会发生若非 x 发生。
   −
==== 充分因 ====
+
==== 充分因 Sufficient Causes ====
 
对于y的充分因x,x的存在意味着y接下来会发生。然而另一个原因z也可能独立地造成y的发生。即y的发生不要求x的发生。  
 
对于y的充分因x,x的存在意味着y接下来会发生。然而另一个原因z也可能独立地造成y的发生。即y的发生不要求x的发生。  
   −
==== 部分因 ====
+
==== 部分因 Contributory Causes ====
 
对于y的部分因x,x的存在会增加y的似然。如果似然是100%,那么x就是充分的。部分因也是必要的。
 
对于y的部分因x,x的存在会增加y的似然。如果似然是100%,那么x就是充分的。部分因也是必要的。
   −
=== 模型 ===
+
=== 模型 Model ===
   −
==== 因果图 ====
+
==== 因果图 Causal Diagram ====
    
因果图是一个有向图,它显示了因果模型中变量间的因果关系。因果图包括一组变量(或节点),每个节点通过箭头连接到一个或多个对其具有因果效应的其他节点。箭头描绘了因果的方向,例如,将变量 A 和 变量B 以指向 B 的箭头相连表示A的变化以某种概率导致B的变化。一条路径是两个节点间沿着因果箭头的图的遍历。
 
因果图是一个有向图,它显示了因果模型中变量间的因果关系。因果图包括一组变量(或节点),每个节点通过箭头连接到一个或多个对其具有因果效应的其他节点。箭头描绘了因果的方向,例如,将变量 A 和 变量B 以指向 B 的箭头相连表示A的变化以某种概率导致B的变化。一条路径是两个节点间沿着因果箭头的图的遍历。
第114行: 第114行:  
因果图和它们的定量概率无关,对这些概率的更改不需要修改因果图。
 
因果图和它们的定量概率无关,对这些概率的更改不需要修改因果图。
   −
==== 模型元素 ====
+
==== 模型元素 Model elements ====
 
因果模型具有形式结构,其元素具有特定的属性。
 
因果模型具有形式结构,其元素具有特定的属性。
   −
===== 接合方式 =====
+
===== 接合方式 Junction Patterns =====
 
三个节点的连接类型有三种,分别是线型的链,分支型的叉和合并型的对撞。
 
三个节点的连接类型有三种,分别是线型的链,分支型的叉和合并型的对撞。
   −
===== =====
+
===== 链接合 Chain =====
链是直线连接,箭头从原因指向结果。在这个模型中,B是中介变量,因为它调节了 A 对 C 的影响。
+
链接合是直线连接,箭头从原因指向结果。在这个模型中,B是中介变量,因为它调节了 A 对 C 的影响。
 
:<math> A \rightarrow B \rightarrow C</math>
 
:<math> A \rightarrow B \rightarrow C</math>
===== =====
+
===== 叉接合 Fork =====
在叉中,一个原因有多种结果,这两种结果有一个共同的原因。 A 和 C 之间存在非因果的虚假相关性,可以通过把 B 作为条件(选取B的特定值)来消除虚假相关性。
+
在叉接合中,一个原因有多种结果,这两种结果有一个共同的原因。 A 和 C 之间存在非因果的虚假相关性,可以通过把 B 作为条件(选取B的特定值)来消除虚假相关性。
 
:<math> A \leftarrow B \rightarrow C</math>
 
:<math> A \leftarrow B \rightarrow C</math>
 
“把B作为条件”是指“给定B”(即B取某个值)。
 
“把B作为条件”是指“给定B”(即B取某个值)。
某些情况下叉是混杂因子:
+
某些情况下叉接合是混杂因子:
 
:<math> A \leftarrow B \rightarrow C \rightarrow A</math>
 
:<math> A \leftarrow B \rightarrow C \rightarrow A</math>
 
在这样的模型中, B 是 A 和 C 的共同原因( C 也是 A 的原因),这使B成为'''<font color="#ff8000"> 混杂因子 Confounder </font>'''。
 
在这样的模型中, B 是 A 和 C 的共同原因( C 也是 A 的原因),这使B成为'''<font color="#ff8000"> 混杂因子 Confounder </font>'''。
===== 对撞 =====
+
===== 对撞 Collider =====
 
在对撞接合中,多种原因会影响一种结果。以 B 为条件( B 取特定值)通常会揭示 A 与 C 之间的非因果的负相关。这种负相关被称为对撞偏差和“辩解”效应,即 B 解释了 A 与 C 之间的相关性。 A 和 C 两者都是影响 B 的必要因时,该相关性是正的。
 
在对撞接合中,多种原因会影响一种结果。以 B 为条件( B 取特定值)通常会揭示 A 与 C 之间的非因果的负相关。这种负相关被称为对撞偏差和“辩解”效应,即 B 解释了 A 与 C 之间的相关性。 A 和 C 两者都是影响 B 的必要因时,该相关性是正的。
 
:<math> A \rightarrow B \leftarrow C</math>
 
:<math> A \rightarrow B \leftarrow C</math>
   −
==== 节点类型 ====
+
==== 节点类型 Node Types ====
===== 中介变量 =====
+
===== 中介变量 Mediator =====
 
中介变量节点修改了其他原因对结果的影响(这与原因简单地影响结果不同)。例如,在上面的链结构中,B是中介变量,因为它修改了 C 的间接原因 A 对结果变量 C 的影响。
 
中介变量节点修改了其他原因对结果的影响(这与原因简单地影响结果不同)。例如,在上面的链结构中,B是中介变量,因为它修改了 C 的间接原因 A 对结果变量 C 的影响。
   −
===== 混杂因子 =====
+
===== 混杂因子 Confounder =====
 
混杂因子节点影响多个结果,从而在它们之间产生正相关。
 
混杂因子节点影响多个结果,从而在它们之间产生正相关。
   −
===== 工具变量 =====
+
===== 工具变量 Instrumental Variable =====
 
满足如下条件的是工具变量:(1)有通往结果变量的路径(2)没有通往其他原因变量(解释变量)的路径(3)对结果没有直接影响。
 
满足如下条件的是工具变量:(1)有通往结果变量的路径(2)没有通往其他原因变量(解释变量)的路径(3)对结果没有直接影响。
 
回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。
 
回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。
第147行: 第147行:  
:<math> Z \rightarrow X \rightarrow Y \leftarrow U \rightarrow X</math>
 
:<math> Z \rightarrow X \rightarrow Y \leftarrow U \rightarrow X</math>
 
Z是一种工具变量,因为它有一条通往结果Y的路径,并且不受U的混杂。
 
Z是一种工具变量,因为它有一条通往结果Y的路径,并且不受U的混杂。
===== 孟德尔随机化 =====
+
 
 +
===== 孟德尔随机化 Mendelian randomization =====
    
定义:孟德尔随机化使用已知功能的基因,来观察研究中可改变的部分对疾病的因果关系。
 
定义:孟德尔随机化使用已知功能的基因,来观察研究中可改变的部分对疾病的因果关系。
第153行: 第154行:  
由于基因在人群中随机变化,基因的存在通常可以视为工具变量。这意味着在许多情况下,可以使用观察性研究中的回归来量化因果关系。
 
由于基因在人群中随机变化,基因的存在通常可以视为工具变量。这意味着在许多情况下,可以使用观察性研究中的回归来量化因果关系。
   −
== 关联 ==
+
== 关联 Associations ==
=== 独立性条件 ===
+
=== 独立性条件 Independence Conditions ===
    
独立性条件是用于确定两个变量是否彼此独立的规则。如果一个变量的值不直接影响另一个变量的值,则两个变量是独立的。多个因果模型可以共享独立条件。例如,模型
 
独立性条件是用于确定两个变量是否彼此独立的规则。如果一个变量的值不直接影响另一个变量的值,则两个变量是独立的。多个因果模型可以共享独立条件。例如,模型
第165行: 第166行:  
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中, B 作为条件意味着给定 B 的取值的观察,此时不应显示出 A 和 C 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。
 
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中, B 作为条件意味着给定 B 的取值的观察,此时不应显示出 A 和 C 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。
   −
=== 混杂/去混杂 ===
+
=== 混杂/去混杂 Confounder/Deconfounder ===
    
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。
 
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。
第185行: 第186行:  
传统上, B 被认为是混杂因子,因为它与 X 和 Y 关联,但 B 既不在因果路径上,也不是因果路径上任何节点的后代。控制 B 将使 B 成为混杂因子。这被称为M偏差。
 
传统上, B 被认为是混杂因子,因为它与 X 和 Y 关联,但 B 既不在因果路径上,也不是因果路径上任何节点的后代。控制 B 将使 B 成为混杂因子。这被称为M偏差。
   −
=== 后门调整 ===
+
=== 后门调整 Backdoor Adjustment ===
 
为了分析因果模型中X对Y的因果效应,我们需要针对所有混杂变量进行调整(去混杂)。为了确定混杂变量的集合,我们需要(1)通过该集合阻塞X和Y之间的每个非因果路径(2)不破坏任何原有的因果路径(3)不创建任何虚假路径。
 
为了分析因果模型中X对Y的因果效应,我们需要针对所有混杂变量进行调整(去混杂)。为了确定混杂变量的集合,我们需要(1)通过该集合阻塞X和Y之间的每个非因果路径(2)不破坏任何原有的因果路径(3)不创建任何虚假路径。
   第197行: 第198行:  
:<math> P(Y|do(X))=\sum_z{P(Y|X,Z=z)P(Z=z)}</math>
 
:<math> P(Y|do(X))=\sum_z{P(Y|X,Z=z)P(Z=z)}</math>
   −
=== 前门调整 ===
+
=== 前门调整 Frontdoor Adjustment ===
    
如果阻塞路径的所有元素都不可观测,则后门路径不可计算,但是如果所有从 X 到 Y 的路径都有元素 z ,并且 z 到 Y 没有开放的路径,那么我们可以使用 z 的集合 Z 来测量<math> P(Y|do(X))</math>。实际上 Z 作为 X 的代理时有一些条件。
 
如果阻塞路径的所有元素都不可观测,则后门路径不可计算,但是如果所有从 X 到 Y 的路径都有元素 z ,并且 z 到 Y 没有开放的路径,那么我们可以使用 z 的集合 Z 来测量<math> P(Y|do(X))</math>。实际上 Z 作为 X 的代理时有一些条件。
第209行: 第210行:  
假定上述概率涉及到的观察数据可用,则无需进行实验即可计算出最终概率,而不管是否存在其他混杂路径且无需进行后门调整。
 
假定上述概率涉及到的观察数据可用,则无需进行实验即可计算出最终概率,而不管是否存在其他混杂路径且无需进行后门调整。
   −
==干预==
+
== 干预 Interventions ==
   −
===查询===
+
=== 查询 Queries ===
    
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):
 
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):
第220行: 第221行:  
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
 
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
   −
===do演算===
+
=== Do演算 Do-calculus ===
do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。
+
Do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。Do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。
 +
 
 
====规则集====
 
====规则集====
 
该运算包括了三条涉及do算子的条件概率变换规则。
 
该运算包括了三条涉及do算子的条件概率变换规则。
第236行: 第238行:  
:<math> P(Y|do(X))=P(Y)</math>
 
:<math> P(Y|do(X))=P(Y)</math>
 
在原图中X和Y间没有因果路径。
 
在原图中X和Y间没有因果路径。
=====扩展=====
+
=====扩展 Entensions =====
 
这些规则并不意味着任何查询都能移除do算子。有些情况下,将一个不能进行的操作换成另一个可以进行的操作也是有意义的。例如:
 
这些规则并不意味着任何查询都能移除do算子。有些情况下,将一个不能进行的操作换成另一个可以进行的操作也是有意义的。例如:
 
:<math> P(心脏病|do(血胆固醇))=P(心脏病|do(饮食))</math>
 
:<math> P(心脏病|do(血胆固醇))=P(心脏病|do(饮食))</math>
   −
==反事实==
+
==反事实 Counterfactuals ==
    
反事实考虑那些无法从数据中得到的概率,如一个不吸烟的人在过去重度吸烟的话,他现在会不会得癌症。
 
反事实考虑那些无法从数据中得到的概率,如一个不吸烟的人在过去重度吸烟的话,他现在会不会得癌症。
   −
===潜在结果===
+
===潜在结果Potential Outcome ===
    
定义:Y的潜在结果是“如果X被赋值为x,对于个体u来说Y会怎么样”。数学上可以表达为
 
定义:Y的潜在结果是“如果X被赋值为x,对于个体u来说Y会怎么样”。数学上可以表达为
第254行: 第256行:  
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。
 
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。
   −
===因果推断===
+
===因果推断 Causal inference ===
    
在因果模型的语境中,潜在结果是被从因果角度解释的,而非从统计角度解释。
 
在因果模型的语境中,潜在结果是被从因果角度解释的,而非从统计角度解释。
第266行: 第268行:  
:<math> Y_x(u)=Y_{M_x}(u)</math>
 
:<math> Y_x(u)=Y_{M_x}(u)</math>
 
<!--  
 
<!--  
===计算反事实===
+
=== 计算反事实 Conducting a counterfactual ===
 
用一个因果模型计算反事实包括三步。这种方法不管模型是线性还是非线性都有效。当因果关系确定时,可以计算出一个点估计。在其他情况下(如仅能计算概率时),可以计算出一个概率区间,如原本不吸烟的人如果吸烟会增加10-20%的癌症概率。
 
用一个因果模型计算反事实包括三步。这种方法不管模型是线性还是非线性都有效。当因果关系确定时,可以计算出一个点估计。在其他情况下(如仅能计算概率时),可以计算出一个概率区间,如原本不吸烟的人如果吸烟会增加10-20%的癌症概率。
 
在这个模型中,
 
在这个模型中,
 
:<math> Y \leftarrow X \rightarrow M \rightarrow Y \leftarrow U</math>
 
:<math> Y \leftarrow X \rightarrow M \rightarrow Y \leftarrow U</math>
 
<font color="#32cd32"> the equations for calculating the values of A and C derived from regression analysis or another technique can be applied, substituting known values from an observation and fixing the value of other variables (the counterfactual)</font>
 
<font color="#32cd32"> the equations for calculating the values of A and C derived from regression analysis or another technique can be applied, substituting known values from an observation and fixing the value of other variables (the counterfactual)</font>
====归因====
+
====归因 Abduct====
 
应用归纳推理(使用观察来找到最简单/最可能的解释的逻辑推理)来估计u,它是支持反事实的特定观察上未观察到的变量的代理。根据命题证据计算u的概率。
 
应用归纳推理(使用观察来找到最简单/最可能的解释的逻辑推理)来估计u,它是支持反事实的特定观察上未观察到的变量的代理。根据命题证据计算u的概率。
====行动====
+
====行动 Act====
 
对于特定观察,使用do算子建立反事实(如令m = 0),从而相应地修改方程式。
 
对于特定观察,使用do算子建立反事实(如令m = 0),从而相应地修改方程式。
====预测====
+
====预测 Predict ====
 
使用修改后的公式计算输出(y)的值。
 
使用修改后的公式计算输出(y)的值。
===中介===
+
===中介Mediation ===
 
直接原因和间接原因(中介)可以通过执行反事实区分。理解中介需要在干预直接原因时保持中介恒定。在模型
 
直接原因和间接原因(中介)可以通过执行反事实区分。理解中介需要在干预直接原因时保持中介恒定。在模型
 
:<math> Y \leftarrow M \leftarrow X \rightarrow Y</math>
 
:<math> Y \leftarrow M \leftarrow X \rightarrow Y</math>
第284行: 第286行:  
对于线性模型,可以通过取中介路径上所有路径系数的乘积来计算间接效应。总间接效应是通过各个间接效应的和计算得出的。对于线性模型,当拟合的不包括中介的方程式的系数与包含中介的方程式的系数显着不同时,<font color="#32cd32"> For linear models mediation is indicated when the coefficients of an equation fitted without including the mediator vary significantly from an equation that includes it</font>
 
对于线性模型,可以通过取中介路径上所有路径系数的乘积来计算间接效应。总间接效应是通过各个间接效应的和计算得出的。对于线性模型,当拟合的不包括中介的方程式的系数与包含中介的方程式的系数显着不同时,<font color="#32cd32"> For linear models mediation is indicated when the coefficients of an equation fitted without including the mediator vary significantly from an equation that includes it</font>
   −
===直接效应===
+
===直接效应 Direct effect===
    
在这样模型的实验中,受控直接效应(CDE)通过将M强行赋值(do(M=0))和随机化(do(X=0),do(X=1),...),然后观察Y的结果值获得。
 
在这样模型的实验中,受控直接效应(CDE)通过将M强行赋值(do(M=0))和随机化(do(X=0),do(X=1),...),然后观察Y的结果值获得。
第293行: 第295行:  
例如,考虑每年或几年去看牙科医生的次数(X)的直接效应,去看牙科医生会使牙科医生鼓励人们使用牙线(M)。牙龈(Y)因此变得更健康,这归因于牙科医生(直接)或牙线(中介/间接)。需要进行的实验是继续使用牙线,但不去看牙科医生。
 
例如,考虑每年或几年去看牙科医生的次数(X)的直接效应,去看牙科医生会使牙科医生鼓励人们使用牙线(M)。牙龈(Y)因此变得更健康,这归因于牙科医生(直接)或牙线(中介/间接)。需要进行的实验是继续使用牙线,但不去看牙科医生。
   −
===间接效应===
+
===间接效应 Indirect effect ===
    
X对Y的间接效应是<font color="#32cd32">increase we would see in Y while holding X constant and increasing M to whatever value M would attain under a unit increase in X </font>。
 
X对Y的间接效应是<font color="#32cd32">increase we would see in Y while holding X constant and increasing M to whatever value M would attain under a unit increase in X </font>。
第305行: 第307行:  
  -->
 
  -->
   −
==可移植性==
+
==可移植性 Transportability==
    
即使因果模型及对应的相关数据不同,因果模型也提供了一种工具来集成跨数据集的数据,称为移植。例如,调查数据可以与随机对照实验数据合并。移植提供了一个外部有效性问题的解决方案,即一项研究是否可以在不同的背景下应用。
 
即使因果模型及对应的相关数据不同,因果模型也提供了一种工具来集成跨数据集的数据,称为移植。例如,调查数据可以与随机对照实验数据合并。移植提供了一个外部有效性问题的解决方案,即一项研究是否可以在不同的背景下应用。
第319行: 第321行:  
do演算为移植提供了一个一般性准则:目标变量可以通过一系列不涉及任何“差异”变量(能够区分两个总体的变量)的do运算转换为另一个表达式。有一个类似的规则适用于参与者相对不同的研究。
 
do演算为移植提供了一个一般性准则:目标变量可以通过一系列不涉及任何“差异”变量(能够区分两个总体的变量)的do运算转换为另一个表达式。有一个类似的规则适用于参与者相对不同的研究。
   −
==贝叶斯网络==
+
==贝叶斯网络 Bayesian network==
    
因果模型可以用贝叶斯网实现。贝叶斯网络可用于提供事件的逆概率(给定结果,反推具体原因的概率是多少)。这就需要准备一个条件概率表,显示所有可能的输入和结果以及相关的概率。
 
因果模型可以用贝叶斯网实现。贝叶斯网络可用于提供事件的逆概率(给定结果,反推具体原因的概率是多少)。这就需要准备一个条件概率表,显示所有可能的输入和结果以及相关的概率。
第360行: 第362行:  
贝叶斯网络在商业上可用于如无线数据纠错和DNA分析之类的应用中。
 
贝叶斯网络在商业上可用于如无线数据纠错和DNA分析之类的应用中。
   −
==不变量/语境==
+
==不变量/语境Invariants/Context ==
    
因果的不同概念涉及不变关系的概念。在识别手写数字的情况下,数字形状决定含义,因此形状和含义是不变量,改变形状会改变含义。其他属性则没有此性质(如颜色)。此不变性对于在各种非不变量所构成语境中生成的数据集都应满足。与其使用汇总的数据集进行学习评估因果关系,不如对一个数据集进行学习并对另一数据集进行测试,这可以帮助将变化属性与不变量区分开。
 
因果的不同概念涉及不变关系的概念。在识别手写数字的情况下,数字形状决定含义,因此形状和含义是不变量,改变形状会改变含义。其他属性则没有此性质(如颜色)。此不变性对于在各种非不变量所构成语境中生成的数据集都应满足。与其使用汇总的数据集进行学习评估因果关系,不如对一个数据集进行学习并对另一数据集进行测试,这可以帮助将变化属性与不变量区分开。
  −
Category:Causal diagrams
  −
类别: 因果图表
  −
Category:Causality
  −
分类: 因果关系
  −
Category:Formal epistemology
  −
范畴: 形式认识论
  −
Category:Scientific modeling
  −
类别: 科学建模
  −
  −
<noinclude>
      
<small>This page was moved from [[wikipedia:en:Causal model]]. Its edit history can be viewed at [[结构因果模型/edithistory]]</small></noinclude>
 
<small>This page was moved from [[wikipedia:en:Causal model]]. Its edit history can be viewed at [[结构因果模型/edithistory]]</small></noinclude>
    
[[Category:待整理页面]]
 
[[Category:待整理页面]]
58

个编辑

导航菜单