更改

有效信息 (查看源代码)

2024年5月25日 (六) 08:39的版本

删除34字节、 2024年5月25日 (星期六)

第64行：第64行：

===为什么干预成均匀分布？===

−

在[[Erik Hoel]]的原始定义中，[[do操作]]是将因变量~~[<nowiki/>[~~[math]]]X~~[<nowiki/>[~~[/math]]]干预成了在其定义域[[math]]\mathcal{X}[[/math]]上的[[均匀分布]]（也就是[[最大熵分布]]）。那么，为什么要干预成[[均匀分布]]呢？其它分布是否也可以？

+

在[[Erik Hoel]]的原始定义中，[[do操作]]是将因变量[math]X[/math]干预成了在其定义域[math]\mathcal{X}[/math]上的[[均匀分布]]（也就是[[最大熵分布]]）。那么，为什么要干预成[[均匀分布]]呢？其它分布是否也可以？

−

首先，根据上一小节的论述，[[do操作]]的实质是希望让EI能够更清晰地刻画[[因果机制]][[math]]f[[/math]]的性质，因此，需要切断因变量[math]X[/math]与其它变量的联系，并改变其分布，让EI度量与[math]X[/math]的分布无关。

+

首先，根据上一小节的论述，[[do操作]]的实质是希望让EI能够更清晰地刻画[[因果机制]][math]f[/math]的性质，因此，需要切断因变量[math]X[/math]与其它变量的联系，并改变其分布，让EI度量与[math]X[/math]的分布无关。

而之所以要把输入变量干预为[[最大熵]]下的[[均匀分布]]，其实就是要更好地刻画[[因果机制]]的特性。为什么这么说呢？

Jake

332

个编辑

更改

有效信息 (查看源代码)

2024年5月25日 (六) 08:39的版本

导航菜单

搜索