更改

跳到导航 跳到搜索
删除95字节 、 2024年6月7日 (星期五)
第118行: 第118行:  
==为什么要使用do算子?==
 
==为什么要使用do算子?==
   −
不难看出,尽管EI本质上就是[[互信息]],但是与传统[[信息论]]中的[[互信息]]不同,有效信息EI在定义中包含了[[do操作]],即对输入变量做了一个[[干预]]操作。为什么要引入这一操作呢?
+
不难看出,尽管EI本质上就是[[互信息]],但是与传统[[信息论]]中的[[互信息]]不同,有效信息EI在定义中包含了[[do操作]],即对输入变量做了一个[[干预操作]]。为什么要引入这一操作呢?
   −
根据[[Judea Pearl]]的[[因果阶梯理论]],即变量之间的因果联系可以被划分为三种层次:关联-[[干预]]-[[反事实]]。直接对观测数据估测[[互信息]],便是在度量关联程度;而如果我们能对变量做[[干预]]操作,即设定变量为某个值或服从某个分布,便上升到了干预的层级;反事实则是设想如果某变量不是当前取值,那么其他变量会是什么样。因此,阶梯层级越高,因果特征越明显。在EI的定义中引入了[math]do[/math]操作,则使得EI能够比[[互信息]]更能体现因果特征。
+
根据[[Judea Pearl]]的[[因果阶梯理论]]<ref name=pearl_causality>,即变量之间的因果联系可以被划分为三种层次:关联-[[干预]]-[[反事实]]。阶梯层级越高,因果特征越明显。直接对观测数据估测[[互信息]],便是在度量关联程度;而如果我们能对变量做[[干预]]操作,即设定变量为某个值或服从某个分布,便上升到了干预的层级。在EI的定义中引入了[math]do[/math]操作,则使得EI能够比[[互信息]]更能体现因果特征。
   −
而从实际意义上来讲,在EI的计算中引入[[do算子]],则可以把数据和动力学分开,从而消除数据分布对EI度量所带来的影响。事实上,在一般的因果研究当中,[[do算子]]是在消除指向某个变量所有的因果箭头,可以避免[[混杂因子]]造成的[[虚假关联]]。因此,EI定义中的[[do算子]]也可以消除所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不客观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
+
而从实际意义上来讲,在EI的计算中引入[[do算子]],则可以把数据和动力学分开,从而消除数据分布(即[math]X[/math]的分布)对EI度量所带来的影响。事实上,在一般的[[因果图]]上,[[do算子]]是一种消除指向被干预变量所有的因果箭头的操作,这种操作可以避免[[混杂因子]]造成的[[虚假关联]]。因此,EI定义中的[[do算子]]也可以消除所有指向因变量[math]X[/math]的因果箭头,包括其它变量(包括不可观测的变量)对[math]X[/math]的影响,从而使得EI更能够刻画动力学本身的特性。
      −
[[do算子]]的引入让EI这个指标与其他信息度量指标截然不同,关键在于它是且仅是[[因果机制]]的函数,一方面这使得它比其他想要刻画因果的指标(比如[[转移熵]])更能抓住因果概念的本质,另一方面它需要你能够已知或获取到[[因果机制]],这在只有观测数据的情况下造成了计算上的困难。
+
[[do算子]]的引入让EI这个指标与其他信息度量指标截然不同,关键在于它是且仅是[[因果机制]]的函数,一方面这一特性使得它比其他指标(比如[[转移熵]])更能抓住因果概念的本质,另一方面它需要我们能够已知或获取到[[因果机制]],这在只有观测数据的情况下存在一定的困难。
 
  −
然而,值得指出的是,EI定义里面的[[do操作]]
      
==为什么干预成均匀分布?==
 
==为什么干预成均匀分布?==
372

个编辑

导航菜单