更改

跳到导航 跳到搜索
第48行: 第48行:  
这里,[math]X[/math]是因变量,[math]Y[/math]是果变量,[math]P[/math]表示[math]X[/math]到[math]Y[/math]的因果机制。当[math]X, Y[/math]均为离散状态分布的情境下,[math]P[/math]为概率转移矩阵,[math]p_{ij}\equiv Pr(Y=j|X=i)[/math]。[math]do(X\sim U(\mathcal{X}))[/math]代表对[math]X[/math]实施[[do干预]](或称[[do操作]],英文是do-operator),使其服从[math]\mathcal{X}[/math]上的均匀分布[math]U(\mathcal{X})[/math],也即是[[最大熵分布]]。在这一干预下,因果机制P保持不变。EI指标度量的是经过do干预后的因变量X与果变量Y之间的互信息。
 
这里,[math]X[/math]是因变量,[math]Y[/math]是果变量,[math]P[/math]表示[math]X[/math]到[math]Y[/math]的因果机制。当[math]X, Y[/math]均为离散状态分布的情境下,[math]P[/math]为概率转移矩阵,[math]p_{ij}\equiv Pr(Y=j|X=i)[/math]。[math]do(X\sim U(\mathcal{X}))[/math]代表对[math]X[/math]实施[[do干预]](或称[[do操作]],英文是do-operator),使其服从[math]\mathcal{X}[/math]上的均匀分布[math]U(\mathcal{X})[/math],也即是[[最大熵分布]]。在这一干预下,因果机制P保持不变。EI指标度量的是经过do干预后的因变量X与果变量Y之间的互信息。
   −
do干预这一步是根据[[Judea Pearl]]的[[因果阶梯理论]]<ref name=pearl_causality />提出的。该理论中,[[因果推断]]包含了三个层次,分别是:关联、[[干预]]和[[反事实]]。阶梯层级越高,因果特征越明显。在EI的定义中引入了[math]do[/math]操作上升到干预层级,即设定变量为某个值或服从某个分布,使得EI能够比直接计算[[互信息]]更能体现因果特征。从实际意义上来讲,在EI的计算中引入[[do操作]],可以把数据和动力学分开,消除数据分布(即[math]X[/math]的分布)对EI度量所带来的影响,均匀分布也避免了对数据分布的“偏见”。从因果图角度来看,[[do操作]]可以消除EI中的所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不可观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
+
do干预这一步是根据[[Judea Pearl]]的[[因果阶梯理论]]<ref>Judea Pearl; 刘礼; 杨矫云; 廖军; 李廉 (4 2022). 因果论——模型、推理和推断. 机械工业出版社.</ref>提出的。该理论中,[[因果推断]]包含了三个层次,分别是:关联、[[干预]]和[[反事实]]。阶梯层级越高,因果特征越明显。在EI的定义中引入了[math]do[/math]操作上升到干预层级,即设定变量为某个值或服从某个分布,使得EI能够比直接计算[[互信息]]更能体现因果特征。从实际意义上来讲,在EI的计算中引入[[do操作]],可以把数据和动力学分开,消除数据分布(即[math]X[/math]的分布)对EI度量所带来的影响,均匀分布也避免了对数据分布的“偏见”。从因果图角度来看,[[do操作]]可以消除EI中的所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不可观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
    
* '''马尔科夫动力系统EI'''
 
* '''马尔科夫动力系统EI'''
2,435

个编辑

导航菜单