更改

NIS+ (查看源代码)

2024年9月27日 (五) 12:21的版本

添加2字节、 2024年9月27日 (星期五)

第396行：第396行：

式中，<math>\tilde{p}</math>表示随机变量<math>Y_t</math>被干预情况下的概率分布函数。

−

作者使用神经网络来拟合分布<math>g(y_t|x_t+1)</math>，根据引理3，<math>g(y_t|x_t+1)</math>可以是任何分布，在这里，假设<math>g(y_t|~~x_t~~+1)</math>为正态分布，即<math>g(\boldsymbol{y}_t|\boldsymbol{x}_{t+1})\sim N(\mu,\Sigma)</math>，其中<math>\mu =g_{\theta'}(\phi(\boldsymbol{x}_{t+1}))</math>，<math>\Sigma=diag(\sigma_1, \sigma_2,\cdot\cdot\cdot,\sigma_q)</math>是常数对角矩阵，进一步，假设<math>\sigma_i</math>是有界的，则<math>\sigma_i\in[\sigma_m,\sigma_M]</math>，其中<math>\sigma_m</math>和<math>\sigma_M</math>分别是MSE的最小值和最大值。则<math>g(y_t|x_t+1)</math>的对数概率密度函数为：

+

作者使用神经网络来拟合分布<math>g(y_t|x_t+1)</math>，根据引理3，<math>g(y_t|x_t+1)</math>可以是任何分布，在这里，假设<math>g(y_t|x_{t+1})</math>为正态分布，即<math>g(\boldsymbol{y}_t|\boldsymbol{x}_{t+1})\sim N(\mu,\Sigma)</math>，其中<math>\mu =g_{\theta'}(\phi(\boldsymbol{x}_{t+1}))</math>，<math>\Sigma=diag(\sigma_1, \sigma_2,\cdot\cdot\cdot,\sigma_q)</math>是常数对角矩阵，进一步，假设<math>\sigma_i</math>是有界的，则<math>\sigma_i\in[\sigma_m,\sigma_M]</math>，其中<math>\sigma_m</math>和<math>\sigma_M</math>分别是MSE的最小值和最大值。则<math>g(y_t|x_t+1)</math>的对数概率密度函数为：

<math>\ln g(\boldsymbol{y}_t|\boldsymbol{x}_{t+1})\approx \ln \frac{1}{(2\pi)^{\frac{m}{2}}|\Sigma|^\frac{1}{2}} e^{-\frac{(\boldsymbol{y}_t-g_{\theta'}(\phi(\boldsymbol{x}_{t+1})))^2}{2|\Sigma|}} = -\frac{(\boldsymbol{y}_t-g_{\theta'}(\phi(\boldsymbol{x}_{t+1})))^2}{2|\Sigma|}+\ln \frac{1}{(2\pi)^{\frac{m}{2}}|\Sigma|^\frac{1}{2}} ≥ -\frac{(\boldsymbol{y}_t-g_{\theta'}(\phi(\boldsymbol{x}_{t+1})))^2}{2|\Sigma|}+\ln \frac{1}{(2\pi)^{\frac{m}{2}}|\Sigma|_{max}^\frac{1}{2}} </math>

念

259

个编辑

更改

NIS+ (查看源代码)

2024年9月27日 (五) 12:21的版本

导航菜单

搜索