更改

添加2,326字节 、 2021年6月5日 (六) 15:49
无编辑摘要
第172行: 第172行:  
具有相同的独立条件,因为<math> B </math>作为条件时<math> A </math>和<math> C </math>独立。但是,这两个模型的含义不同,还可能与数据不符(也就是说,如果观测数据显示在<math> B </math>作为条件后显示了<math> A </math>和<math> C </math>之间的关联,那么这两个模型都是不正确的)。相反,数据无法显示这两个模型中的哪个是正确的,因为它们具有相同的独立性条件。
 
具有相同的独立条件,因为<math> B </math>作为条件时<math> A </math>和<math> C </math>独立。但是,这两个模型的含义不同,还可能与数据不符(也就是说,如果观测数据显示在<math> B </math>作为条件后显示了<math> A </math>和<math> C </math>之间的关联,那么这两个模型都是不正确的)。相反,数据无法显示这两个模型中的哪个是正确的,因为它们具有相同的独立性条件。
   −
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中,<math> B </math>作为条件意味着给定<math> B</math> 的取值的观察,此时不应显示出<math> A </math>和<math> C</math> 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。
+
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中,<math> B </math>作为条件意味着给定<math> B</math> 的取值的观察,此时不应显示出<math> A </math>和<math> C</math> 之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=129}} 129–130]}}
    
=== 混杂/去混杂 Confounder/Deconfounder ===
 
=== 混杂/去混杂 Confounder/Deconfounder ===
   −
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。
+
设计相关性研究的基本要素是确定对所研究变量的潜在混杂影响。控制这些变量是为了消除这些影响。但是,这些混杂变量无法被先验地正确确定。因此,一项研究可能会控制不相关的变量,甚至(间接地)控制了所研究的变量。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=139}} 139]}}
 
因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式上,如果“ <math>Y</math> 通过不经过<math> X</math> 的路径与 <math>Z</math> 关联”,则<math> Z</math> 是混杂因素。这些混杂变量通常可以使用其他研究所收集的数据来确定。数学上,如果
 
因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式上,如果“ <math>Y</math> 通过不经过<math> X</math> 的路径与 <math>Z</math> 关联”,则<math> Z</math> 是混杂因素。这些混杂变量通常可以使用其他研究所收集的数据来确定。数学上,如果
 
:<math> P(Y|X) \neq P(Y|do(X))</math>
 
:<math> P(Y|X) \neq P(Y|do(X))</math>
那么X是Y的混杂因子。
+
那么X是Y的混杂因子。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=151}} 151]}}
   −
在此之前,混杂因子的不正确的定义包括:
+
在此之前,混杂因子的不正确的定义包括:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=152}} 152]}}
    
(1)“与<math>X</math>和<math>Y</math>都相关的任何变量。”
 
(1)“与<math>X</math>和<math>Y</math>都相关的任何变量。”
第198行: 第198行:  
在模型中
 
在模型中
 
:<math> X \leftarrow A \rightarrow B \leftarrow C \rightarrow Y</math>
 
:<math> X \leftarrow A \rightarrow B \leftarrow C \rightarrow Y</math>
传统上,<math> B</math> 被认为是混杂因子,因为它与<math> X </math>和<math> Y</math> 关联,但 <math>B</math> 既不在因果路径上,也不是因果路径上任何节点的后代。控制 <math>B</math> 将使<math> B</math> 成为混杂因子。这被称为M偏差。
+
传统上,<math> B</math> 被认为是混杂因子,因为它与<math> X </math>和<math> Y</math> 关联,但 <math>B</math> 既不在因果路径上,也不是因果路径上任何节点的后代。控制 <math>B</math> 将使<math> B</math> 成为混杂因子。这被称为M偏差。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=161}} 161]}}
    
=== 后门调整 Backdoor Adjustment ===
 
=== 后门调整 Backdoor Adjustment ===
为了分析因果模型中<math>X</math>对<math>Y</math>的因果效应,我们需要针对所有混杂变量进行调整(去混杂)。为了确定混杂变量的集合,我们需要
+
为了分析因果模型中<math>X</math>对<math>Y</math>的因果效应,我们需要针对所有混杂变量进行调整(去混杂)。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=158}} 158]}}为了确定混杂变量的集合,我们需要
    
(1)通过该集合阻塞<math>X</math>和<math>Y</math>之间的每个非因果路径
 
(1)通过该集合阻塞<math>X</math>和<math>Y</math>之间的每个非因果路径
第209行: 第209行:  
(3)不创建任何虚假路径
 
(3)不创建任何虚假路径
   −
定义:从<math>X</math>到<math>Y</math>的后门路径是指,从从<math> X</math> 到<math> Y</math> 的任何以指向<math> X</math> 的箭头为开始的路径。
+
定义:从<math>X</math>到<math>Y</math>的后门路径是指,从从<math> X</math> 到<math> Y</math> 的任何以指向<math> X</math> 的箭头为开始的路径。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=158}} 158]}}
    
定义:给定模型中的一对有序变量<math>(X,Y)</math>,如果
 
定义:给定模型中的一对有序变量<math>(X,Y)</math>,如果
第219行: 第219行:  
则称混杂变量集<math>Z</math>满足后门准则。
 
则称混杂变量集<math>Z</math>满足后门准则。
   −
如果<math>(X,Y)</math>满足后门准则,则在控制混杂变量集<math> Z</math> 时<math> X</math> 和<math> Y</math> 是无混杂的。除了混杂变量外,没有必要控制其他任何变量。后门准则是找到混杂变量<math> Z </math>的集合的充分条件,但不是分析<math> X </math>对<math> Y </math>的因果效应必要条件。
+
如果<math>(X,Y)</math>满足后门准则,则在控制混杂变量集<math> Z</math> 时<math> X</math> 和<math> Y</math> 是无混杂的。除了混杂变量外,没有必要控制其他任何变量。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=158}} 158]}}后门准则是找到混杂变量<math> Z </math>的集合的充分条件,但不是分析<math> X </math>对<math> Y </math>的因果效应必要条件。
   −
当因果模型是现实的合理表示并且满足后门准则时,则对于线性关系可以将'''<font color="#ff8000"> 偏回归系数 Partial Regression Coefficients </font>'''作为'''<font color="#ff8000"> (因果)路径系数 (Causal) Path Coefficients </font>'''。
+
当因果模型是现实的合理表示并且满足后门准则时,则对于线性关系可以将'''<font color="#ff8000"> 偏回归系数 Partial Regression Coefficients </font>'''作为'''<font color="#ff8000"> (因果)路径系数 (Causal) Path Coefficients </font>'''。<ref name=":1"/>{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=223}} 223]}} <ref>{{harvnb|Pearl|2009|loc=[http://bayes.cs.ucla.edu/BOOK-2K/ch3-3.pdf chapter 3-3 Controlling Confounding Bias]}}</ref>
 
:<math> P(Y|do(X))=\sum_z{P(Y|X,Z=z)P(Z=z)}</math>
 
:<math> P(Y|do(X))=\sum_z{P(Y|X,Z=z)P(Z=z)}</math>
   第228行: 第228行:  
如果阻塞路径的所有元素都不可观测,则后门路径不可计算,但是如果所有从<math> X </math>到<math> Y </math>的路径都有元素<math> z</math> ,并且<math> z</math> 到<math> Y </math>没有开放的路径,那么我们可以使用<math> z </math>的集合<math> Z </math>来测量<math> P(Y|do(X))</math>。实际上<math> Z </math>作为<math> X </math>的代理时有一些条件。
 
如果阻塞路径的所有元素都不可观测,则后门路径不可计算,但是如果所有从<math> X </math>到<math> Y </math>的路径都有元素<math> z</math> ,并且<math> z</math> 到<math> Y </math>没有开放的路径,那么我们可以使用<math> z </math>的集合<math> Z </math>来测量<math> P(Y|do(X))</math>。实际上<math> Z </math>作为<math> X </math>的代理时有一些条件。
   −
定义:前门路径是这样的直接因果路径
+
定义:前门路径是这样的直接因果路径<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=226}} 226]}}
    
(1)<math>Z</math>阻断了所有<math>X</math>到<math>Y</math>的有向路径
 
(1)<math>Z</math>阻断了所有<math>X</math>到<math>Y</math>的有向路径
第236行: 第236行:  
(3)所有<math>Z</math>到<math>Y</math>的后门路径都被<math>X</math>阻断
 
(3)所有<math>Z</math>到<math>Y</math>的后门路径都被<math>X</math>阻断
   −
以下式子通过将前门路径上的变量集<math>Z</math>作条件,将含有do的表达式转化成不含do的表达式:
+
以下式子通过将前门路径上的变量集<math>Z</math>作条件,将含有do的表达式转化成不含do的表达式:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=226}} 226]}}
    
:<math> P(Y|do(X))=\sum_z{[P(Z=z|X)\sum_x{P(Y|X=x,Z=z)P(X=x)}]}</math>
 
:<math> P(Y|do(X))=\sum_z{[P(Z=z|X)\sum_x{P(Y|X=x,Z=z)P(X=x)}]}</math>
   −
假定上述概率涉及到的观察数据可用,则无需进行实验即可计算出最终概率,而不管是否存在其他混杂路径且无需进行后门调整。
+
假定上述概率涉及到的观察数据可用,则无需进行实验即可计算出最终概率,而不管是否存在其他混杂路径且无需进行后门调整。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=226}} 226]}}
    
== 干预 Interventions ==
 
== 干预 Interventions ==
第246行: 第246行:  
=== 查询 Queries ===
 
=== 查询 Queries ===
   −
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):
+
查询是根据特定模型提出的问题。通常通过进行干预实验来回答这些问题。“干预”会设定模型中一个变量的值并观察结果。从数学上讲,此类查询采用以下形式(例子):<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=8}} 8]}}
 
:<math> P(牙线价格|do(牙膏价格))</math>
 
:<math> P(牙线价格|do(牙膏价格))</math>
   −
其中do算子表示该实验明确修改牙膏的价格。图模型上看,这可以阻止任何可能影响该变量的因果变量。这消除了所有指向实验变量(牙膏价格)的因果箭头。
+
其中do算子表示该实验明确修改牙膏的价格。图模型上看,这可以阻止任何可能影响该变量的因果变量。这消除了所有指向实验变量(牙膏价格)的因果箭头。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=40}} 40]}}
    
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
 
do算子也可以应用于多个变量(使它们取值固定)进行更复杂的查询。
    
=== Do演算 Do-calculus ===
 
=== Do演算 Do-calculus ===
Do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。Do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。
+
Do演算是一组可用于将一个表达式转换为另一个表达式的一系列操作,其总体目标是将包含do算子的表达式转换为不包含do算子的表达式。不含do算子的表达式可以仅从观察数据中估计出来,而无需进行实验干预;而实验干预可能是代价大,耗时长甚至是不道德的(例如,要求受试者吸烟)。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=231}} 231]}}Do演算的规则集是完备的,可用于推导出该系统中的每个真命题。有一种算法可以确定对于给定模型,是否可以在多项式时间内求解。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=238}} 238]}}
    
====do演算规则集 Do-Calculus Rules====
 
====do演算规则集 Do-Calculus Rules====
第261行: 第261行:  
该版本是维基百科上do演算的表达方式。
 
该版本是维基百科上do演算的表达方式。
   −
规则1用来增删观测:
+
规则1用来增删观测:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
 
:<math> P(Y|do(X),Z,W)=P(Y|do(X),Z)</math>
 
:<math> P(Y|do(X),Z,W)=P(Y|do(X),Z)</math>
在删除所有指向<math>X</math>的箭头的图中,<math>Z</math>阻塞了所有从<math>W</math>到<math>Y</math>的路径。
+
在删除所有指向<math>X</math>的箭头的图中,<math>Z</math>阻塞了所有从<math>W</math>到<math>Y</math>的路径。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}}
   −
规则2用来互换干预和观测:
+
规则2用来互换干预和观测:<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
 
:<math> P(Y|do(X),Z)=P(Y|X,Z)</math>
 
:<math> P(Y|do(X),Z)=P(Y|X,Z)</math>
在原图中<math>Z</math>满足后门准则。
+
在原图中<math>Z</math>满足后门准则。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}}
   −
规则3用来增删干预:
+
规则3用来增删干预:<ref name=":1" />
 
:<math> P(Y|do(X))=P(Y)</math>
 
:<math> P(Y|do(X))=P(Y)</math>
在原图中<math>X</math>和<math>Y</math>间没有因果路径。
+
在原图中<math>X</math>和<math>Y</math>间没有因果路径。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=234}} 234]}} {{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=235}} 235]}}
    
=====版本2=====
 
=====版本2=====
第311行: 第311行:  
===潜在结果 Potential Outcome ===
 
===潜在结果 Potential Outcome ===
   −
定义:Y的潜在结果是“如果<math>X</math>被赋值为<math>x</math>,对于个体<math>u</math>来说<math>Y</math>会怎么样”。数学上可以表达为
+
定义:Y的潜在结果{{clarify|reason=What is an individual in this context?|date=January 2019}}是“如果<math>X</math>被赋值为<math>x</math>,对于个体<math>u</math>来说<math>Y</math>会怎么样”。数学上可以表达为<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=270}}
    
:<math> Y_X=Y_x(u)</math>
 
:<math> Y_X=Y_x(u)</math>
   −
潜在结果是在个体<math>u</math>的层次定义的。
+
潜在结果是在个体<math>u</math>的层次定义的。<ref name=":1" />''{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=270}} 270]}}
   −
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。
+
传统的潜在结果是数据驱动的,而非模型驱动的,这限制了它辨析因果关系的能力。它将因果问题当作数据缺失问题,甚至在标准场景下都会给出错误的回答。<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=275}} 275]}}
    
===因果推断 Causal inference ===
 
===因果推断 Causal inference ===
第327行: 第327行:  
:<math> Y_x(u)</math>
 
:<math> Y_x(u)</math>
   −
可以被这样计算:将因果模型<math>M</math>中指向<math>X</math>的箭头删除,计算特定的<math>x</math>的结果。形式上,
+
可以被这样计算:将因果模型<math>M</math>中指向<math>X</math>的箭头删除,计算特定的<math>x</math>的结果。形式上,<ref name=":1" />{{rp|[{{google books|plainurl=y|id=9H0dDQAAQBAJ|page=280}} 280]}}
    
:<math> Y_x(u)=Y_{M_x}(u)</math>
 
:<math> Y_x(u)=Y_{M_x}(u)</math>
134

个编辑