第654行: |
第654行: |
| y的积分区间为:[math]f([-\frac{L}{L},\frac{L}{2}])[/math],即将x的定义域[math][-\frac{L}{2},\frac{L}{2}][/math]经过f的映射,形成y上的区间范围。 | | y的积分区间为:[math]f([-\frac{L}{L},\frac{L}{2}])[/math],即将x的定义域[math][-\frac{L}{2},\frac{L}{2}][/math]经过f的映射,形成y上的区间范围。 |
| | | |
− | [math]p(y)=\int_{-\frac{L}{2}}^{\frac{L}{2}}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x))^2}{\sigma^2}\right)dx[/math]为y的概率密度函数,它也可以由联合概率密度函数[math]p(x,y)=p(x)p(y|x)[/math]对x进行积分得到。
| + | <math> |
| + | p(y)=\int_{-\frac{L}{2}}^{\frac{L}{2}}p(x_0)p(y|x_0)dx_0=\int_{-\frac{L}{2}}^{\frac{L}{2}}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x_0))^2}{\sigma^2}\right)dx_0 |
| + | </math> |
| + | |
| + | 为y的概率密度函数,它也可以由联合概率密度函数[math]p(x,y)=p(x)p(y|x)[/math]对x进行积分得到。为了后续叙述方便,我们将x重新命名为[math]x_0[/math],从而以区分出现在{{EquationNote|4}}中的其它x变量。 |
| | | |
| 由于L很大,所以区间[math][-\frac{L}{2},\frac{L}{2}][/math],进而假设区间[math]f([-\frac{L}{L},\frac{L}{2}])[/math]也很大。这就使得,上述积分的积分上下界可以近似取到无穷大,也就有{{EquationNote|4}}中的第一项为: | | 由于L很大,所以区间[math][-\frac{L}{2},\frac{L}{2}][/math],进而假设区间[math]f([-\frac{L}{L},\frac{L}{2}])[/math]也很大。这就使得,上述积分的积分上下界可以近似取到无穷大,也就有{{EquationNote|4}}中的第一项为: |
第666行: |
第670行: |
| </math> | | </math> |
| | | |
− | 其中,e为自然对数的底,最后一个等式是根据高斯分布函数的Shannon熵公式计算得出的。然而,要计算第二项,即使使用了积分区间为无穷大这个条件,仍然很难计算得出结果,为此,我们对函数f(x)进行一阶泰勒展开:
| + | 其中,e为自然对数的底,最后一个等式是根据高斯分布函数的Shannon熵公式计算得出的。 |
| + | |
| + | 然而,要计算第二项,即使使用了积分区间为无穷大这个条件,仍然很难计算得出结果,为此,我们对函数f(x)进行一阶泰勒展开: |
| | | |
| <math> | | <math> |
− | f(x)\approx f(x_0)+f'(x_0)(x-x_0) | + | f(x_0)\approx f(x)+f'(x)(x_0-x) |
| </math> | | </math> |
| | | |
− | 这里,[math]x_0\in[-\frac{L}{2},\frac{L}{2}][/math]是x定义域上的任意一点。 | + | 这里,[math]x\in[-\frac{L}{2},\frac{L}{2}][/math]是x定义域上的任意一点。 |
| | | |
| 因此,p(y)可以被近似计算: | | 因此,p(y)可以被近似计算: |
| | | |
| <math> | | <math> |
− | p(y)\approx \int_{-\infty}^{\infty}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x_0)-f'(x_0)(x-x_0))^2}{\sigma^2}\right)dx\approx \frac{1}{L}\cdot\frac{1}{f'(x_0)} | + | p(y)\approx \int_{-\infty}^{\infty}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x)-f'(x)(x_0-x))^2}{\sigma^2}\right)dx\approx \frac{1}{L}\cdot\frac{1}{f'(x)} |
| </math> | | </math> |
| | | |
− | 值得注意的是,在这一步中,我们不仅将f(x)近似为一个线性函数,同时还引入了一个假设,即p(y)的结果与y无关,而与[math]x_0[/math],以及[math]x_0[/math]处f的导数有关。这一点怎么理解呢?我们知道y的数值是由x经过映射f(x)而决定的,因此y的分布,取决于x的分布以及映射f(x)。现在,我们将f(x)映射展开成任意一点x<sub>0</sub>处的一阶近似,而x又在p(y)的计算中被积分掉了,因此p(y)就仅仅取决于x<sub>0</sub>。 | + | 值得注意的是,在这一步中,我们不仅将f(x)近似为一个线性函数,同时还引入了一个假设,即p(y)的结果与y无关,而与[math]x[/math]有关。我们知道在对EI计算的第二项中包含着对x的积分,因此这一近似也就意味着不同x处的p(y)近似是不同的。 |
| | | |
| 这样,{{EquationNote|4}}中的第二项近似为: | | 这样,{{EquationNote|4}}中的第二项近似为: |
第686行: |
第692行: |
| <math> | | <math> |
| \begin{aligned} | | \begin{aligned} |
− | \int_{-\frac{L}{2}}^{\frac{L}{2}}\int_{f([-\frac{L}{2},\frac{L}{2}])}p(x_0)p(y|x_0)\ln p(y)dydx_0\approx \frac{1}{L}\int_{-\frac{L}{2}}^{\frac{L}{2}}\ln f'(x_0)dx_0 | + | \int_{-\frac{L}{2}}^{\frac{L}{2}}\int_{f([-\frac{L}{2},\frac{L}{2}])}p(x)p(y|x)\ln p(y)dydx\approx \frac{1}{L}\int_{-\frac{L}{2}}^{\frac{L}{2}}\ln f'(x)dx |
| \end{aligned} | | \end{aligned} |
| </math> | | </math> |