更改

跳到导航 跳到搜索
删除34字节 、 2024年5月25日 (星期六)
第64行: 第64行:  
===为什么干预成均匀分布?===
 
===为什么干预成均匀分布?===
   −
在[[Erik Hoel]]的原始定义中,[[do操作]]是将因变量[<nowiki/>[[math]]]X[<nowiki/>[[/math]]]干预成了在其定义域[[math]]\mathcal{X}[[/math]]上的[[均匀分布]](也就是[[最大熵分布]])。那么, 为什么要干预成[[均匀分布]]呢?其它分布是否也可以?
+
在[[Erik Hoel]]的原始定义中,[[do操作]]是将因变量[math]X[/math]干预成了在其定义域[math]\mathcal{X}[/math]上的[[均匀分布]](也就是[[最大熵分布]])。那么, 为什么要干预成[[均匀分布]]呢?其它分布是否也可以?
   −
首先,根据上一小节的论述,[[do操作]]的实质是希望让EI能够更清晰地刻画[[因果机制]][[math]]f[[/math]]的性质,因此,需要切断因变量[math]X[/math]与其它变量的联系,并改变其分布,让EI度量与[math]X[/math]的分布无关。
+
首先,根据上一小节的论述,[[do操作]]的实质是希望让EI能够更清晰地刻画[[因果机制]][math]f[/math]的性质,因此,需要切断因变量[math]X[/math]与其它变量的联系,并改变其分布,让EI度量与[math]X[/math]的分布无关。
    
而之所以要把输入变量干预为[[最大熵]]下的[[均匀分布]],其实就是要更好地刻画[[因果机制]]的特性。为什么这么说呢?
 
而之所以要把输入变量干预为[[最大熵]]下的[[均匀分布]],其实就是要更好地刻画[[因果机制]]的特性。为什么这么说呢?
332

个编辑

导航菜单