更改

删除7字节 、 2024年7月6日 (星期六)
第124行: 第124行:  
不难看出,尽管EI本质上就是[[互信息]],但是与传统[[信息论]]中的[[互信息]]不同,有效信息EI在定义中包含了[[do操作]],即对输入变量做了一个[[干预操作]]。为什么要引入这一操作呢?
 
不难看出,尽管EI本质上就是[[互信息]],但是与传统[[信息论]]中的[[互信息]]不同,有效信息EI在定义中包含了[[do操作]],即对输入变量做了一个[[干预操作]]。为什么要引入这一操作呢?
   −
根据[[Judea Pearl]]的[[因果阶梯理论]]<ref name=pearl_causality />,即变量之间的因果联系可以被划分为三种层次:关联-[[干预]]-[[反事实]]。阶梯层级越高,因果特征越明显。直接对观测数据估测[[互信息]],便是在度量关联程度;而如果我们能对变量做[[干预]]操作,即设定变量为某个值或服从某个分布,便上升到了干预的层级。在EI的定义中引入了[math]do[/math]操作,则使得EI能够比[[互信息]]更能体现因果特征。
+
根据[[Judea Pearl]]的[[因果阶梯理论]]<ref name=pearl_causality />,[[因果推断]]包含了三个层次,分别是:关联、[[干预]][[反事实]]。阶梯层级越高,因果特征越明显。直接对观测数据估测[[互信息]],便是在度量关联程度;而如果我们能对变量做[[干预]]操作,即设定变量为某个值或服从某个分布,便上升到了干预的层级。在EI的定义中引入了[math]do[/math]操作,则使得EI能够比[[互信息]]更能体现因果特征。
    
而从实际意义上来讲,在EI的计算中引入[[do算子]],则可以把数据和动力学分开,从而消除数据分布(即[math]X[/math]的分布)对EI度量所带来的影响。事实上,在一般的[[因果图]]上,[[do算子]]是一种消除指向被干预变量所有的因果箭头的操作,这种操作可以避免[[混杂因子]]造成的[[虚假关联]]。因此,EI定义中的[[do算子]]也可以消除所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不可观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
 
而从实际意义上来讲,在EI的计算中引入[[do算子]],则可以把数据和动力学分开,从而消除数据分布(即[math]X[/math]的分布)对EI度量所带来的影响。事实上,在一般的[[因果图]]上,[[do算子]]是一种消除指向被干预变量所有的因果箭头的操作,这种操作可以避免[[混杂因子]]造成的[[虚假关联]]。因此,EI定义中的[[do算子]]也可以消除所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不可观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
786

个编辑