更改

有效信息 (查看源代码)

2024年6月7日 (五) 15:27的版本

添加1,169字节、 2024年6月7日 (星期五)

→‎一维函数映射

第622行：第622行：

===一维函数映射===

+

首先，我们考虑最简单的情况：

+

<math>

y=f(x)+\varepsilon, \varepsilon\sim\mathcal{N}(0,\epsilon^2)

</math>

−

其中，[math]x,y\in \mathcal{R}[/math]~~都是一维实数变量。我们计算这个随机映射的有效信息为：~~

+

其中，[math]x,y\in \mathcal{R}[/math]都是一维实数变量。按照有效信息的定义，我们需要对变量x进行干预，使其满足在其定义域空间上的均匀分布。如果x的定义域为一个固定的区间，如[a,b]，其中a,b都是实数，那么x的概率密度函数就是[math]1/(b-a)[/math]。然而，当x的定义域为全体实数的时候，区间成为了无穷大，而x的概率密度函数就成为了无穷小。

−

~~如果只存在观测噪声，设干预空间大小为<~~math>L

+

为了解决这个问题，我们假设x的定义域不是整个实数空间，而是一个足够大的区域：[math][-L/2,L/2][/math]，其中L为该区间的大小。这样，该区域上的均匀分布的密度函数为：[math]1/L[/math]，从而实施有效信息的计算。我们希望当[math]L\rightarrow +\infty[/math]的时候，EI能够收敛到一个有限的数。然而，实际的EI是一个和x定义域大小有关的量，所以EI是参数L的函数。这一点可以从EI的定义中看出：

−

~~</math>，观测噪声~~<math>\~~epsilon~~\~~ll 1~~

+

<math>

−

+

\begin{aligned}

−

</~~math>，有效信息EI为：~~

+

EI&=I(y;x|do(x\sim U[-L/2,L/2]))\\

−

+

&=\int_{-L/2}^{L/2}\int_{f([-L/2,L/2])}p(x)p(y|x)\ln\frac{p(y|x)}{p(y)}dydx\\

−

~~<math>EI~~ \~~approx~~ \ln(\frac{L}{\sqrt{2\pi e}})+\frac{1}{2L}\int_{-L/2}^{L/2}\ln \left(\frac{f'(x)}{\~~epsilon~~}\right)~~^2dx.~~

+

&=\int_{-L/2}^{L/2}\int_{f([-L/2,L/2])}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x))^2}{\sigma^2}\right)\ln\frac{\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x))^2}{\sigma^2}\right)}{\int_{-L/2}^{L/2}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(z))^2}{\sigma^2}\right)dz}dydx

+

\end{aligned}

</math>

+

\approx \ln(\frac{L}{\sqrt{2\pi e}})+\frac{1}{2L}\int_{-L/2}^{L/2}\ln \left(\frac{f'(x)}{\epsilon}\right)^2dx.

如果同时考虑两种噪声，并且如果干预空间大小为<math>L

Jake

712

个编辑