第60行: |
第60行: |
| <font color="#ff8000">因果模型框架 Causal Models Framework</font>从<font color="#ff8000">结构方程(structural equations)Structural Equation Model</font>系统的角度分析反事实。在一个方程系统中,每个变量都被分配了一个值,这个值是系统中其他变量的显式函数。给定这样一个模型,“如果X是X,Y就会是Y(''Y'' would be ''y'' had ''X'' been ''x'')”这个句子 (形式上为 ''X = x'' > ''Y = y'' )被定义为断言。如果我们用一个常数''X = x''取代当前决定 ''X''的方程,并求解变量''Y''的方程组,得到的解将是''Y = y''。这个定义已被证明与可能世界语义学的公理兼容,并构成自然科学和社会科学中因果推理的基础。因为这些领域的每个结构方程都对应于一个熟悉的因果机制,这个因果机制可以被研究者进行有意义地推理。这种方法是由Judea Pearl(2000)提出的,作为编码关于因果关系的细粒度直觉的手段,这些直觉在其他提议的系统中难以捕捉。<ref name="Pearl2000">{{Cite book |last=Pearl |first=Judea |title=Causality |publisher=Cambridge University Press |year=2000 }}</ref> | | <font color="#ff8000">因果模型框架 Causal Models Framework</font>从<font color="#ff8000">结构方程(structural equations)Structural Equation Model</font>系统的角度分析反事实。在一个方程系统中,每个变量都被分配了一个值,这个值是系统中其他变量的显式函数。给定这样一个模型,“如果X是X,Y就会是Y(''Y'' would be ''y'' had ''X'' been ''x'')”这个句子 (形式上为 ''X = x'' > ''Y = y'' )被定义为断言。如果我们用一个常数''X = x''取代当前决定 ''X''的方程,并求解变量''Y''的方程组,得到的解将是''Y = y''。这个定义已被证明与可能世界语义学的公理兼容,并构成自然科学和社会科学中因果推理的基础。因为这些领域的每个结构方程都对应于一个熟悉的因果机制,这个因果机制可以被研究者进行有意义地推理。这种方法是由Judea Pearl(2000)提出的,作为编码关于因果关系的细粒度直觉的手段,这些直觉在其他提议的系统中难以捕捉。<ref name="Pearl2000">{{Cite book |last=Pearl |first=Judea |title=Causality |publisher=Cambridge University Press |year=2000 }}</ref> |
| | | |
− | ===因果模型下的定义=== | + | ===因果模型下的反事实定义=== |
| 令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号<math> Y_x(u) </math>来描述,表明变量集Y对X取x的反应。 | | 令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号<math> Y_x(u) </math>来描述,表明变量集Y对X取x的反应。 |
| | | |
| ===反事实基本定理=== | | ===反事实基本定理=== |
| ====等价定理==== | | ====等价定理==== |
− | 令<math> M_x</math>表示结构方程模型M的修改版本(在关于X的结构方程中用X=x来代替),反事实具备下述等价性质:\\ | + | 令<math> M_x</math>表示结构方程模型M的修改版本(在关于X的结构方程中用X=x来代替),反事实具备下述等价性质: |
− | <math>Y_x(u)=Y_{M_x}(u)</math> | + | :<math>Y_x(u)=Y_{M_x}(u)</math> |
| | | |
| ====一致性定理==== | | ====一致性定理==== |
− | 若X和Y是观测变量,<math>Y_x</math>为反事实变量,以下性质成立:\\ | + | 若X和Y是观测变量,<math>Y_x</math>为反事实变量,以下性质成立: |
− | <math>if \ X = x, \ then \ Y_x=Y</math>。 | + | :<math>if \ X = x, \ then \ Y_x=Y</math> |
| + | 特别地,当X是二值变量时,以下等式成立: |
| + | :<math>Y=XY_1+(1-X)Y_0</math> |
| + | |
| + | ===非确定性模型中反事实的计算=== |
| + | 非确定性的因果模型通过对外生变量U赋予概率分布P(U = u)来引入不确定性,从而唯一导致了内生变量V的分布P(V=v)。计算反事实期望<math>E[Y_x=y|E = e]</math>的步骤为: |
| + | :'''第一步 归因(Abduction):''' 通过观测证据E=e来计算外生变量的条件分布<math>P(U \mid E=e)</math>,并用条件分布来估计外生变量的边际分布P(U)。 |
| + | :'''第二步 行动(Action):''' 修改模型M,通过将结构方程中关于X的方程替换成X=x,来获得修改后的模型<math>M_x</math>。 |
| + | :'''第三步 预策(Prediction):''' 使用估计的外生变量分布<math>P(U \mid E=e)</math>以及修改模型<math>M_x</math>,计算Y的期望,即为反事实期望<math>E[Y_x=y|E = e]</math>。 |
| + | |
| + | ===常见的反事实问题模式=== |
| + | ====治疗组治疗效应ETT==== |
| + | 治疗组的治疗效应(effect of treatment on the treated,ETT)被定义为: |
| + | :<math>E[Y_x-Y_{x'} \mid X=x]</math> |
| + | 若存在一组可观测变量Z,且Z是符合X到Y之间后门准则的变量集,则ETT可识别,可用下式对其进行估计: |
| + | :<math>ETT = E[Y_1-Y_0|X=1]=E[Y_1|X=1] - E[Y_0|X=1] = E[Y|X=1] - \sum_z E[Y|X=0,Z=z]P(Z=z,X1)</math> |
| + | 进一步地,若考虑完全线性模型,则可用含有因果效应斜率<math>\tau</math>的式子来估计(<math>\tau=E[Y_{x+1}-Y_{x}]</math>): |
| + | :<math>ETT = E[Y_1-Y_0|X=1] = E[Y_1|X=1] - E[Y_0|X=0] = E[Y|X=1] + \tau (1-E[Z|X=1]) - E[Y|X=1] - \tau (0-E[Z|X=1])</math> |
| + | |
| + | ====归因问题(PN,PS,PNS)==== |
| + | 令X=x,Y=y为治疗组,必要性概率(probability of necessity)被定义为: |
| + | :<math>PN=P(Y_{x'}=y' \mid X=x,Y=y)</math> |
| + | 充分性概率(probability of sufficiency)被定义为: |
| + | :<math>PS=P(Y_{x}=y \mid X=x',Y=y')</math> |
| + | 必要充分性概率(probability of necessity and sufficiency)被定义为: |
| + | :<math>PNS=P(Y_{x'}=y' ,Y_x=y)</math> |
| + | 三者之间的联系为: |
| + | :<math>PNS=P(x,y) \cdot PN + P(x',y') \cdot PS</math> |
| + | 定义过剩风险率(Excess Risk Ratio, ERR)为:<math>ERR=\frac{P(y|x)-P(y|x')}{P(y|x)}</math>,混杂因子(Confounding Factor, CF)为:<math>ERR=\frac{P(y|x')-P(y|do(x'))}{P(x,y)}</math>,令<math>q=P(y'|x)/P(y|x)</math>,则PN可以由上下界UB、LB来估计: |
| + | :<math>LB = ERR + CF \ , \ UB = ERR + CF + q</math> |
| + | :<math>max\left\{ 0, LB \right\} \leq PN \leq min\left\{ 1, UB \right\}</math> |
| + | |
| + | ====中介问题==== |
| + | 定义总因果效应:<math>TE = E[Y_1-Y_0] = E[Y|do(T=1)] - E[Y|do(T=0)]</math>。 |
| + | |
| + | 自然直接因果效应:<math>NDE = E[Y_{1,M_0}-Y_{0,M_0}] = E[Y|do(T=1), M|do(T=0)] - E[Y|do(T=0), M|do(T=0)]]</math>。 |
| + | |
| + | 自然间接因果效应:<math>NIE = E[Y_{0,M_1}-Y_{0,M_0}] = E[Y|do(T=0), M|do(T=1)] - E[Y|do(T=0), M|do(T=0)]</math>。 |
| + | |
| + | 在线性系统中,有如下等式关系: |
| + | :<math>TE=NDE+NIE</math> |
| | | |
| ==逻辑和语义== | | ==逻辑和语义== |