更改

添加2,930字节 、 2021年6月2日 (三) 16:10
第60行: 第60行:  
<font color="#ff8000">因果模型框架 Causal Models Framework</font>从<font color="#ff8000">结构方程(structural equations)Structural Equation Model</font>系统的角度分析反事实。在一个方程系统中,每个变量都被分配了一个值,这个值是系统中其他变量的显式函数。给定这样一个模型,“如果X是X,Y就会是Y(''Y'' would be ''y'' had ''X'' been ''x'')”这个句子 (形式上为  ''X = x'' > ''Y = y'' )被定义为断言。如果我们用一个常数''X = x''取代当前决定 ''X''的方程,并求解变量''Y''的方程组,得到的解将是''Y = y''。这个定义已被证明与可能世界语义学的公理兼容,并构成自然科学和社会科学中因果推理的基础。因为这些领域的每个结构方程都对应于一个熟悉的因果机制,这个因果机制可以被研究者进行有意义地推理。这种方法是由Judea Pearl(2000)提出的,作为编码关于因果关系的细粒度直觉的手段,这些直觉在其他提议的系统中难以捕捉。<ref name="Pearl2000">{{Cite book |last=Pearl |first=Judea |title=Causality |publisher=Cambridge University Press |year=2000 }}</ref>
 
<font color="#ff8000">因果模型框架 Causal Models Framework</font>从<font color="#ff8000">结构方程(structural equations)Structural Equation Model</font>系统的角度分析反事实。在一个方程系统中,每个变量都被分配了一个值,这个值是系统中其他变量的显式函数。给定这样一个模型,“如果X是X,Y就会是Y(''Y'' would be ''y'' had ''X'' been ''x'')”这个句子 (形式上为  ''X = x'' > ''Y = y'' )被定义为断言。如果我们用一个常数''X = x''取代当前决定 ''X''的方程,并求解变量''Y''的方程组,得到的解将是''Y = y''。这个定义已被证明与可能世界语义学的公理兼容,并构成自然科学和社会科学中因果推理的基础。因为这些领域的每个结构方程都对应于一个熟悉的因果机制,这个因果机制可以被研究者进行有意义地推理。这种方法是由Judea Pearl(2000)提出的,作为编码关于因果关系的细粒度直觉的手段,这些直觉在其他提议的系统中难以捕捉。<ref name="Pearl2000">{{Cite book |last=Pearl |first=Judea |title=Causality |publisher=Cambridge University Press |year=2000 }}</ref>
   −
===因果模型下的定义===
+
===因果模型下的反事实定义===
 
令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号<math> Y_x(u)  </math>来描述,表明变量集Y对X取x的反应。
 
令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号<math> Y_x(u)  </math>来描述,表明变量集Y对X取x的反应。
    
===反事实基本定理===
 
===反事实基本定理===
 
====等价定理====
 
====等价定理====
令<math> M_x</math>表示结构方程模型M的修改版本(在关于X的结构方程中用X=x来代替),反事实具备下述等价性质:\\
+
令<math> M_x</math>表示结构方程模型M的修改版本(在关于X的结构方程中用X=x来代替),反事实具备下述等价性质:
<math>Y_x(u)=Y_{M_x}(u)</math>
+
:<math>Y_x(u)=Y_{M_x}(u)</math>
    
====一致性定理====
 
====一致性定理====
若X和Y是观测变量,<math>Y_x</math>为反事实变量,以下性质成立:\\
+
若X和Y是观测变量,<math>Y_x</math>为反事实变量,以下性质成立:
<math>if \  X = x, \  then \  Y_x=Y</math>。
+
:<math>if \  X = x, \  then \  Y_x=Y</math>
 +
特别地,当X是二值变量时,以下等式成立:
 +
:<math>Y=XY_1+(1-X)Y_0</math>
 +
 
 +
===非确定性模型中反事实的计算===
 +
非确定性的因果模型通过对外生变量U赋予概率分布P(U = u)来引入不确定性,从而唯一导致了内生变量V的分布P(V=v)。计算反事实期望<math>E[Y_x=y|E = e]</math>的步骤为:
 +
:'''第一步 归因(Abduction):''' 通过观测证据E=e来计算外生变量的条件分布<math>P(U \mid E=e)</math>,并用条件分布来估计外生变量的边际分布P(U)。
 +
:'''第二步 行动(Action):''' 修改模型M,通过将结构方程中关于X的方程替换成X=x,来获得修改后的模型<math>M_x</math>。
 +
:'''第三步 预策(Prediction):''' 使用估计的外生变量分布<math>P(U \mid E=e)</math>以及修改模型<math>M_x</math>,计算Y的期望,即为反事实期望<math>E[Y_x=y|E = e]</math>。
 +
 
 +
===常见的反事实问题模式===
 +
====治疗组治疗效应ETT====
 +
治疗组的治疗效应(effect of treatment on the treated,ETT)被定义为:
 +
:<math>E[Y_x-Y_{x'} \mid X=x]</math>
 +
若存在一组可观测变量Z,且Z是符合X到Y之间后门准则的变量集,则ETT可识别,可用下式对其进行估计:
 +
:<math>ETT = E[Y_1-Y_0|X=1]=E[Y_1|X=1] - E[Y_0|X=1] = E[Y|X=1] - \sum_z E[Y|X=0,Z=z]P(Z=z,X1)</math>
 +
进一步地,若考虑完全线性模型,则可用含有因果效应斜率<math>\tau</math>的式子来估计(<math>\tau=E[Y_{x+1}-Y_{x}]</math>):
 +
:<math>ETT  = E[Y_1-Y_0|X=1] = E[Y_1|X=1] - E[Y_0|X=0] = E[Y|X=1] + \tau (1-E[Z|X=1]) - E[Y|X=1] - \tau (0-E[Z|X=1])</math>
 +
 
 +
====归因问题(PN,PS,PNS)====
 +
令X=x,Y=y为治疗组,必要性概率(probability of necessity)被定义为:
 +
:<math>PN=P(Y_{x'}=y' \mid X=x,Y=y)</math>
 +
充分性概率(probability of sufficiency)被定义为:
 +
:<math>PS=P(Y_{x}=y \mid X=x',Y=y')</math>
 +
必要充分性概率(probability of necessity and sufficiency)被定义为:
 +
:<math>PNS=P(Y_{x'}=y' ,Y_x=y)</math>
 +
三者之间的联系为:
 +
:<math>PNS=P(x,y) \cdot PN  + P(x',y') \cdot PS</math>
 +
定义过剩风险率(Excess Risk Ratio, ERR)为:<math>ERR=\frac{P(y|x)-P(y|x')}{P(y|x)}</math>,混杂因子(Confounding Factor, CF)为:<math>ERR=\frac{P(y|x')-P(y|do(x'))}{P(x,y)}</math>,令<math>q=P(y'|x)/P(y|x)</math>,则PN可以由上下界UB、LB来估计:
 +
:<math>LB = ERR + CF  \ , \  UB = ERR + CF + q</math>
 +
:<math>max\left\{ 0, LB \right\} \leq PN \leq min\left\{ 1, UB \right\}</math>
 +
 
 +
====中介问题====
 +
定义总因果效应:<math>TE = E[Y_1-Y_0]  = E[Y|do(T=1)] - E[Y|do(T=0)]</math>。
 +
 
 +
自然直接因果效应:<math>NDE = E[Y_{1,M_0}-Y_{0,M_0}]  = E[Y|do(T=1), M|do(T=0)] - E[Y|do(T=0), M|do(T=0)]]</math>。
 +
 
 +
自然间接因果效应:<math>NIE = E[Y_{0,M_1}-Y_{0,M_0}]  = E[Y|do(T=0), M|do(T=1)] - E[Y|do(T=0), M|do(T=0)]</math>。
 +
 
 +
在线性系统中,有如下等式关系:
 +
:<math>TE=NDE+NIE</math>
    
==逻辑和语义==
 
==逻辑和语义==
48

个编辑