更改

添加402字节 、 2024年9月22日 (星期日)
第317行: 第317行:  
=== 宏观EI的变分下界 ===
 
=== 宏观EI的变分下界 ===
 
'''定理'''1(宏观EI的变分下界):''对于给定的 q 值,由式{{EquationNote|3}}定义的无约束目标函数优化等价于优化式{{EquationNote|1}}中定义的约束目标函数的下界。''
 
'''定理'''1(宏观EI的变分下界):''对于给定的 q 值,由式{{EquationNote|3}}定义的无约束目标函数优化等价于优化式{{EquationNote|1}}中定义的约束目标函数的下界。''
  −
   
优化目标(式{{EquationNote|1}})便转化为:{{NumBlk|:|2=<nowiki>[math]\displaystyle{ \begin{aligned}&\min_{f,g,\phi,\phi\dagger}\sum_{t=1}^{T-1}w(\boldsymbol{x}_t)\parallel\boldsymbol{y}_t-g(\boldsymbol{y}_{t+1})\parallel+\lambda\parallel\hat{x}_{t+1}-\boldsymbol{x}_{t+1}\parallel,\\&s.t.\begin{cases}y_{t}=\phi(x_{t}),\\\hat{y}_{t+1}=f(y_t),\\\hat{x}_{t+1}=\phi^{\dagger}\left(f_{q}(\phi(x_{t})\bigr)\right),\\y_{t+1}=\phi(x_{t+1}).\end{cases}\end{aligned} }[/math]</nowiki>|3={{EquationRef|3}}}}
 
优化目标(式{{EquationNote|1}})便转化为:{{NumBlk|:|2=<nowiki>[math]\displaystyle{ \begin{aligned}&\min_{f,g,\phi,\phi\dagger}\sum_{t=1}^{T-1}w(\boldsymbol{x}_t)\parallel\boldsymbol{y}_t-g(\boldsymbol{y}_{t+1})\parallel+\lambda\parallel\hat{x}_{t+1}-\boldsymbol{x}_{t+1}\parallel,\\&s.t.\begin{cases}y_{t}=\phi(x_{t}),\\\hat{y}_{t+1}=f(y_t),\\\hat{x}_{t+1}=\phi^{\dagger}\left(f_{q}(\phi(x_{t})\bigr)\right),\\y_{t+1}=\phi(x_{t+1}).\end{cases}\end{aligned} }[/math]</nowiki>|3={{EquationRef|3}}}}
   第341行: 第339行:  
\hat{y}_{t}
 
\hat{y}_{t}
 
</math>,<math>λ</math>作为拉格朗日乘子,在实验框架内被认为是一个可调的超参数。
 
</math>,<math>λ</math>作为拉格朗日乘子,在实验框架内被认为是一个可调的超参数。
 
+
{| class="wikitable"
证明:
+
|+证明                                                                                                                                                                                                                                                                                                                                                                                             
 
+
|原始的有约束的目标优化公式如式{{EquationNote|1}}所示。
原始的有约束的目标优化公式如式{{EquationNote|1}}所示。
  −
 
   
在此方程中<math>\hat{X}_{t+1}=\psi_{\omega}^{-1}(\hat{Y}_{t+1}\bigoplus \xi)</math>,其中<math>\psi_{\omega}^{-1}</math>是可逆映射,根据引理1和引理2以及互信息的性质,我们可以得到:
 
在此方程中<math>\hat{X}_{t+1}=\psi_{\omega}^{-1}(\hat{Y}_{t+1}\bigoplus \xi)</math>,其中<math>\psi_{\omega}^{-1}</math>是可逆映射,根据引理1和引理2以及互信息的性质,我们可以得到:
   第392行: 第388行:     
便得到了式{{EquationNote|3}}。
 
便得到了式{{EquationNote|3}}。
 +
|}
    
相关引理:
 
相关引理:
259

个编辑