更改

跳到导航 跳到搜索
删除30字节 、 2024年6月10日 (星期一)
第654行: 第654行:  
y的积分区间为:[math]f([-\frac{L}{L},\frac{L}{2}])[/math],即将x的定义域[math][-\frac{L}{2},\frac{L}{2}][/math]经过f的映射,形成y上的区间范围。
 
y的积分区间为:[math]f([-\frac{L}{L},\frac{L}{2}])[/math],即将x的定义域[math][-\frac{L}{2},\frac{L}{2}][/math]经过f的映射,形成y上的区间范围。
   −
[math]p(y)=\int_{-\frac{L}{2}}^{\frac{L}{2}}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x))^2}{\sigma^2}\right)dx[/math]为y的概率密度函数,它也可以由联合概率密度函数[math]p(x,y)=p(x)p(y|x)[/math]对x进行积分得到。
+
<math>
 +
p(y)=\int_{-\frac{L}{2}}^{\frac{L}{2}}p(x_0)p(y|x_0)dx_0=\int_{-\frac{L}{2}}^{\frac{L}{2}}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x_0))^2}{\sigma^2}\right)dx_0
 +
</math>
 +
 
 +
为y的概率密度函数,它也可以由联合概率密度函数[math]p(x,y)=p(x)p(y|x)[/math]对x进行积分得到。为了后续叙述方便,我们将x重新命名为[math]x_0[/math],从而以区分出现在{{EquationNote|4}}中的其它x变量。
    
由于L很大,所以区间[math][-\frac{L}{2},\frac{L}{2}][/math],进而假设区间[math]f([-\frac{L}{L},\frac{L}{2}])[/math]也很大。这就使得,上述积分的积分上下界可以近似取到无穷大,也就有{{EquationNote|4}}中的第一项为:
 
由于L很大,所以区间[math][-\frac{L}{2},\frac{L}{2}][/math],进而假设区间[math]f([-\frac{L}{L},\frac{L}{2}])[/math]也很大。这就使得,上述积分的积分上下界可以近似取到无穷大,也就有{{EquationNote|4}}中的第一项为:
第666行: 第670行:  
</math>
 
</math>
   −
其中,e为自然对数的底,最后一个等式是根据高斯分布函数的Shannon熵公式计算得出的。然而,要计算第二项,即使使用了积分区间为无穷大这个条件,仍然很难计算得出结果,为此,我们对函数f(x)进行一阶泰勒展开:
+
其中,e为自然对数的底,最后一个等式是根据高斯分布函数的Shannon熵公式计算得出的。
 +
 
 +
然而,要计算第二项,即使使用了积分区间为无穷大这个条件,仍然很难计算得出结果,为此,我们对函数f(x)进行一阶泰勒展开:
    
<math>
 
<math>
f(x)\approx f(x_0)+f'(x_0)(x-x_0)
+
f(x_0)\approx f(x)+f'(x)(x_0-x)
 
</math>
 
</math>
   −
这里,[math]x_0\in[-\frac{L}{2},\frac{L}{2}][/math]是x定义域上的任意一点。
+
这里,[math]x\in[-\frac{L}{2},\frac{L}{2}][/math]是x定义域上的任意一点。
    
因此,p(y)可以被近似计算:
 
因此,p(y)可以被近似计算:
    
<math>
 
<math>
p(y)\approx \int_{-\infty}^{\infty}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x_0)-f'(x_0)(x-x_0))^2}{\sigma^2}\right)dx\approx \frac{1}{L}\cdot\frac{1}{f'(x_0)}
+
p(y)\approx \int_{-\infty}^{\infty}\frac{1}{L}\frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(y-f(x)-f'(x)(x_0-x))^2}{\sigma^2}\right)dx\approx \frac{1}{L}\cdot\frac{1}{f'(x)}
 
</math>
 
</math>
   −
值得注意的是,在这一步中,我们不仅将f(x)近似为一个线性函数,同时还引入了一个假设,即p(y)的结果与y无关,而与[math]x_0[/math],以及[math]x_0[/math]处f的导数有关。这一点怎么理解呢?我们知道y的数值是由x经过映射f(x)而决定的,因此y的分布,取决于x的分布以及映射f(x)。现在,我们将f(x)映射展开成任意一点x<sub>0</sub>处的一阶近似,而x又在p(y)的计算中被积分掉了,因此p(y)就仅仅取决于x<sub>0</sub>。
+
值得注意的是,在这一步中,我们不仅将f(x)近似为一个线性函数,同时还引入了一个假设,即p(y)的结果与y无关,而与[math]x[/math]有关。我们知道在对EI计算的第二项中包含着对x的积分,因此这一近似也就意味着不同x处的p(y)近似是不同的。
    
这样,{{EquationNote|4}}中的第二项近似为:
 
这样,{{EquationNote|4}}中的第二项近似为:
第686行: 第692行:  
<math>
 
<math>
 
\begin{aligned}
 
\begin{aligned}
\int_{-\frac{L}{2}}^{\frac{L}{2}}\int_{f([-\frac{L}{2},\frac{L}{2}])}p(x_0)p(y|x_0)\ln p(y)dydx_0\approx \frac{1}{L}\int_{-\frac{L}{2}}^{\frac{L}{2}}\ln f'(x_0)dx_0
+
\int_{-\frac{L}{2}}^{\frac{L}{2}}\int_{f([-\frac{L}{2},\frac{L}{2}])}p(x)p(y|x)\ln p(y)dydx\approx \frac{1}{L}\int_{-\frac{L}{2}}^{\frac{L}{2}}\ln f'(x)dx
 
\end{aligned}
 
\end{aligned}
 
</math>
 
</math>
786

个编辑

导航菜单