更改

删除2,204字节 、 2021年6月9日 (三) 10:11
无编辑摘要
第140行: 第140行:     
====== 链 Chain ======
 
====== 链 Chain ======
链(结构)是直线连接,箭头从原因指向结果。在这个模型中,<math>B</math>是中介变量,因为它调节了<math> A</math> 对<math> C</math> 的影响。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=113}} 113]}}
+
链(结构)是直线连接,箭头从原因指向结果。在这个模型中,<math>B</math>是中介变量,因为它调节了<math> A</math> 对<math> C</math> 的影响。<ref name=":1" />
 
:<math> A \rightarrow B \rightarrow C</math>
 
:<math> A \rightarrow B \rightarrow C</math>
 
====== 叉 Fork ======
 
====== 叉 Fork ======
在叉(结构)中,一个原因有多种结果,这两种结果有一个共同的原因。 <math>A </math>和<math> C</math> 之间存在非因果的虚假相关性,可以通过把<math> B</math> 作为条件(选取<math>B</math>的特定值)来消除虚假相关性。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=114}} 114]}}
+
在叉(结构)中,一个原因有多种结果,这两种结果有一个共同的原因。 <math>A </math>和<math> C</math> 之间存在非因果的虚假相关性,可以通过把<math> B</math> 作为条件(选取<math>B</math>的特定值)来消除虚假相关性。<ref name=":1" />
 
:<math> A \leftarrow B \rightarrow C</math>
 
:<math> A \leftarrow B \rightarrow C</math>
 
“把B作为条件”是指“给定B”(即B取某个值)。
 
“把B作为条件”是指“给定B”(即B取某个值)。
第156行: 第156行:  
==== 节点类型 Node Types ====
 
==== 节点类型 Node Types ====
 
===== 中介变量 Mediator =====
 
===== 中介变量 Mediator =====
中介变量节点修改了其他原因对结果的影响(这与原因简单地影响结果不同)。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=113}} 113]}}例如,在上面的链结构中,<math>B</math>是中介变量,因为它修改了 <math>C</math> 的间接原因<math> A</math> 对结果变量 <math>C</math> 的影响。
+
中介变量节点修改了其他原因对结果的影响(这与原因简单地影响结果不同)。<ref name=":1" />例如,在上面的链结构中,<math>B</math>是中介变量,因为它修改了 <math>C</math> 的间接原因<math> A</math> 对结果变量 <math>C</math> 的影响。
    
===== 混杂因子 Confounder =====
 
===== 混杂因子 Confounder =====
混杂因子节点影响多个结果,从而在它们之间产生正相关。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=114}} 114]}}
+
混杂因子节点影响多个结果,从而在它们之间产生正相关。<ref name=":1" />
    
===== 工具变量 Instrumental Variable =====
 
===== 工具变量 Instrumental Variable =====
满足如下条件的是工具变量:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=246}} 246]}}
+
满足如下条件的是工具变量:<ref name=":1" />
 
   
(1)有通往结果变量的路径
 
(1)有通往结果变量的路径
   第170行: 第169行:  
(3)对结果没有直接影响
 
(3)对结果没有直接影响
   −
回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=249}} 249]}}
+
回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。<ref name=":1" />
 
例如,给定模型:
 
例如,给定模型:
 
:<math> Z \rightarrow X \rightarrow Y \leftarrow U \rightarrow X</math>
 
:<math> Z \rightarrow X \rightarrow Y \leftarrow U \rightarrow X</math>
第177行: 第176行:  
在上面的例子中,如果Z和X是二进制值,那么Z=0,X=1不出现的假设称为单调性。
 
在上面的例子中,如果Z和X是二进制值,那么Z=0,X=1不出现的假设称为单调性。
   −
对该技术的改进{{clarify|reason=What technique?|date=January 2019}}包括通过调节其他变量{{clarify|reason=What other variable are we talking about?|date=January 2019}}来创建工具变量{{clarify|reason=What is an instrument?|date=January 2019}},以阻断{{clarify|reason=What does it mean to "block a path"?|date=January 2019}}工具变量和混杂因子{{clarify|reason=What cofounder are we talking about?|date=January 2019}}之间的路径{{clarify|reason=What is the exact definition of a path?|date=January 2019}},并组合多个变量以形成单个工具变量{{clarify|date=January 2019}}。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=257}} 257]}}
+
对该技术的改进{{clarify|reason=What technique?|date=January 2019}}包括通过调节其他变量{{clarify|reason=What other variable are we talking about?|date=January 2019}}来创建工具变量{{clarify|reason=What is an instrument?|date=January 2019}},以阻断{{clarify|reason=What does it mean to "block a path"?|date=January 2019}}工具变量和混杂因子{{clarify|reason=What cofounder are we talking about?|date=January 2019}}之间的路径{{clarify|reason=What is the exact definition of a path?|date=January 2019}},并组合多个变量以形成单个工具变量{{clarify|date=January 2019}}。<ref name=":1" />
    
===== 孟德尔随机化 Mendelian randomization =====
 
===== 孟德尔随机化 Mendelian randomization =====
第195行: 第194行:  
具有相同的独立条件,因为<math> B </math>作为条件时<math> A </math>和<math> C </math>独立。但是,这两个模型的含义不同,还可能与数据不符(也就是说,如果观测数据显示在<math> B </math>作为条件后显示了<math> A </math>和<math> C </math>之间的关联,那么这两个模型都是不正确的)。相反,数据无法显示这两个模型中的哪个是正确的,因为它们具有相同的独立性条件。
 
具有相同的独立条件,因为<math> B </math>作为条件时<math> A </math>和<math> C </math>独立。但是,这两个模型的含义不同,还可能与数据不符(也就是说,如果观测数据显示在<math> B </math>作为条件后显示了<math> A </math>和<math> C </math>之间的关联,那么这两个模型都是不正确的)。相反,数据无法显示这两个模型中的哪个是正确的,因为它们具有相同的独立性条件。
   −
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中,<math> B </math>作为条件意味着给定<math> B</math> 的取值的观察,此时不应显示出<math> A </math>和<math> C</math> 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=129}} 129–130]}}
+
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中,<math> B </math>作为条件意味着给定<math> B</math> 的取值的观察,此时不应显示出<math> A </math>和<math> C</math> 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。<ref name=":1" />
    
=== 混杂/去混杂 Confounder/Deconfounder ===
 
=== 混杂/去混杂 Confounder/Deconfounder ===
   −
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=139}} 139]}}
+
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。<ref name=":1" />
 +
 
 
因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式上,如果“ <math>Y</math> 通过不经过<math> X</math> 的路径与 <math>Z</math> 关联”,则<math> Z</math> 是混杂因素。这些混杂变量通常可以使用其他研究所收集的数据来确定。数学上,如果
 
因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式上,如果“ <math>Y</math> 通过不经过<math> X</math> 的路径与 <math>Z</math> 关联”,则<math> Z</math> 是混杂因素。这些混杂变量通常可以使用其他研究所收集的数据来确定。数学上,如果
 
:<math> P(Y|X) \neq P(Y|do(X))</math>
 
:<math> P(Y|X) \neq P(Y|do(X))</math>
那么X是Y的混杂因子。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=151}} 151]}}
+
那么X是Y的混杂因子。<ref name=":1" />
   −
在此之前,混杂因子的不正确的定义包括:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=152}} 152]}}
+
在此之前,混杂因子的不正确的定义包括:<ref name=":1" />
    
(1)“与<math>X</math>和<math>Y</math>都相关的任何变量。”
 
(1)“与<math>X</math>和<math>Y</math>都相关的任何变量。”
第221行: 第221行:  
在模型中
 
在模型中
 
:<math> X \leftarrow A \rightarrow B \leftarrow C \rightarrow Y</math>
 
:<math> X \leftarrow A \rightarrow B \leftarrow C \rightarrow Y</math>
传统上,<math> B</math> 被认为是混杂因子,因为它与<math> X </math>和<math> Y</math> 关联,但 <math>B</math> 既不在因果路径上,也不是因果路径上任何节点的后代。控制 <math>B</math> 将使<math> B</math> 成为混杂因子。这被称为M偏差。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=161}} 161]}}
+
传统上,<math> B</math> 被认为是混杂因子,因为它与<math> X </math>和<math> Y</math> 关联,但 <math>B</math> 既不在因果路径上,也不是因果路径上任何节点的后代。控制 <math>B</math> 将使<math> B</math> 成为混杂因子。这被称为M偏差。<ref name=":1" />
    
=== 后门调整 Backdoor Adjustment ===
 
=== 后门调整 Backdoor Adjustment ===
第270行: 第270行:  
=== 查询 Queries ===
 
=== 查询 Queries ===
   −
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=8}} 8]}}
+
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):<ref name=":1" />
 
:<math> P(牙线价格|do(牙膏价格))</math>
 
:<math> P(牙线价格|do(牙膏价格))</math>
   −
其中do算子表示该实验明确修改牙膏的价格。图模型上看,这可以阻止任何可能影响该变量的因果变量。这消除了所有指向实验变量(牙膏价格)的因果箭头。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=40}} 40]}}
+
其中do算子表示该实验明确修改牙膏的价格。图模型上看,这可以阻止任何可能影响该变量的因果变量。这消除了所有指向实验变量(牙膏价格)的因果箭头。<ref name=":1" />
    
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
 
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
    
=== Do演算 Do-calculus ===
 
=== Do演算 Do-calculus ===
Do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=231}} 231]}}Do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=238}} 238]}}
+
Do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。<ref name=":1" />Do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。<ref name=":1" />
    
====do演算规则集 Do-Calculus Rules====
 
====do演算规则集 Do-Calculus Rules====
第285行: 第285行:  
该版本是维基百科上do演算的表达方式。
 
该版本是维基百科上do演算的表达方式。
   −
规则1用来增删观测:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
+
规则1用来增删观测:<ref name=":1" />
 
:<math> P(Y|do(X),Z,W)=P(Y|do(X),Z)</math>
 
:<math> P(Y|do(X),Z,W)=P(Y|do(X),Z)</math>
在删除所有指向<math>X</math>的箭头的图中,<math>Z</math>阻塞了所有从<math>W</math>到<math>Y</math>的路径。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}}
+
在删除所有指向<math>X</math>的箭头的图中,<math>Z</math>阻塞了所有从<math>W</math>到<math>Y</math>的路径。<ref name=":1" />
   −
规则2用来互换干预和观测:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
+
规则2用来互换干预和观测:<ref name=":1" />
 
:<math> P(Y|do(X),Z)=P(Y|X,Z)</math>
 
:<math> P(Y|do(X),Z)=P(Y|X,Z)</math>
在原图中<math>Z</math>满足后门准则。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}}
+
在原图中<math>Z</math>满足后门准则。<ref name=":1" />
    
规则3用来增删干预:<ref name=":1" />
 
规则3用来增删干预:<ref name=":1" />
 
:<math> P(Y|do(X))=P(Y)</math>
 
:<math> P(Y|do(X))=P(Y)</math>
在原图中<math>X</math>和<math>Y</math>间没有因果路径。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}} {{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
+
在原图中<math>X</math>和<math>Y</math>间没有因果路径。<ref name=":1" />
    
=====版本2=====
 
=====版本2=====
第335行: 第335行:  
===潜在结果 Potential Outcome ===
 
===潜在结果 Potential Outcome ===
   −
定义:Y的潜在结果{{clarify|reason=What is an individual in this context?|date=January 2019}}是“如果<math>X</math>被赋值为<math>x</math>,对于个体<math>u</math>来说<math>Y</math>会怎么样”。数学上可以表达为<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=270}}
+
定义:Y的潜在结果{{clarify|reason=What is an individual in this context?|date=January 2019}}是“如果<math>X</math>被赋值为<math>x</math>,对于个体<math>u</math>来说<math>Y</math>会怎么样”。数学上可以表达为<ref name=":1" />
    
:<math> Y_X=Y_x(u)</math>
 
:<math> Y_X=Y_x(u)</math>
   −
潜在结果是在个体<math>u</math>的层次定义的。<ref name=":1" />''{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=270}} 270]}}
+
潜在结果是在个体<math>u</math>的层次定义的。<ref name=":1" />''
   −
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=275}} 275]}}
+
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。<ref name=":1" />
    
===因果推断 Causal inference ===
 
===因果推断 Causal inference ===
第351行: 第351行:  
:<math> Y_x(u)</math>
 
:<math> Y_x(u)</math>
   −
可以被这样计算:将因果模型<math>M</math>中指向<math>X</math>的箭头删除,计算特定的<math>x</math>的结果。形式上,<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=280}} 280]}}
+
可以被这样计算:将因果模型<math>M</math>中指向<math>X</math>的箭头删除,计算特定的<math>x</math>的结果。形式上,<ref name=":1" />
    
:<math> Y_x(u)=Y_{M_x}(u)</math>
 
:<math> Y_x(u)=Y_{M_x}(u)</math>
第396行: 第396行:  
==可移植性 Transportability==
 
==可移植性 Transportability==
   −
即使因果模型及对应的相关数据不同,因果模型也提供了一种工具来集成跨数据集的数据,称为移植。例如,调查数据可以与随机对照实验数据合并。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=352}} 352]}}移植提供了一个外部有效性问题的解决方案,即一项研究是否可以在不同的背景下应用。
+
即使因果模型及对应的相关数据不同,因果模型也提供了一种工具来集成跨数据集的数据,称为移植。例如,调查数据可以与随机对照实验数据合并。<ref name=":1" />移植提供了一个外部有效性问题的解决方案,即一项研究是否可以在不同的背景下应用。
    
一,如果两个模型在所有相关变量上都匹配,并且已知来自其中一个模型的数据是无偏的,则可以使用一个总体的数据得出关于另一个总体的结论。
 
一,如果两个模型在所有相关变量上都匹配,并且已知来自其中一个模型的数据是无偏的,则可以使用一个总体的数据得出关于另一个总体的结论。
第406行: 第406行:  
四,可以组合(移植)来自多个总体的研究数据,以得出有关未观测总体的结论。
 
四,可以组合(移植)来自多个总体的研究数据,以得出有关未观测总体的结论。
   −
五,结合多个研究的估计值(例如<math>P(W|X)</math>)可以提高结论的准确性。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=355}} 355]}}
+
五,结合多个研究的估计值(例如<math>P(W|X)</math>)可以提高结论的准确性。<ref name=":1" />
 +
 
 +
do演算为移植提供了一个一般性准则:目标变量可以通过一系列不涉及任何“差异”变量(能够区分两个总体的变量)的do运算转换为另一个表达式。<ref name=":1" />有一个类似的规则适用于参与者相对不同的研究。<ref name=":1" />
   −
do演算为移植提供了一个一般性准则:目标变量可以通过一系列不涉及任何“差异”变量(能够区分两个总体的变量)的do运算转换为另一个表达式。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=355}} 355]}}有一个类似的规则适用于参与者相对不同的研究。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=356}} 356]}}
      
==贝叶斯网络 Bayesian network==
 
==贝叶斯网络 Bayesian network==
   −
因果模型可以用贝叶斯网实现。贝叶斯网络可用于提供事件的逆概率(给定结果,反推具体原因的概率是多少)。这就需要准备一个条件概率表,显示所有可能的输入和结果以及相关的概率。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=119}} 119]}}
+
因果模型可以用贝叶斯网实现。贝叶斯网络可用于提供事件的逆概率(给定结果,反推具体原因的概率是多少)。这就需要准备一个条件概率表,显示所有可能的输入和结果以及相关的概率。<ref name=":1" />
例如,给定疾病和针对疾病的检验的两变量模型,条件概率表的形式为:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=117}} 117]}}
+
 
 +
例如,给定疾病和针对疾病的检验的两变量模型,条件概率表的形式为:<ref name=":1" />
    
{| class="wikitable"
 
{| class="wikitable"
第449行: 第451行:  
|}
 
|}
 
根据该表,当患者没有疾病时,测试为阳性的可能性为12%。
 
根据该表,当患者没有疾病时,测试为阳性的可能性为12%。
尽管这对于小问题很容易解决,但是随着变量数量及其相关状态的增加,概率表(以及相关的计算时间)呈指数增长。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=121}} 121]}}
+
尽管这对于小问题很容易解决,但是随着变量数量及其相关状态的增加,概率表(以及相关的计算时间)呈指数增长。<ref name=":1" />
贝叶斯网络在商业上可用于如无线数据纠错和DNA分析之类的应用中。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=122}} 122]}}
+
贝叶斯网络在商业上可用于如无线数据纠错和DNA分析之类的应用中。<ref name=":1" />
    
==不变量/语境Invariants/Context ==
 
==不变量/语境Invariants/Context ==