第97行: |
第97行: |
| 假设复杂动态系统的行为数据是时间序列 <math>\{x_t\}</math>,时间步长<math>t = 1,2,…, T</math>,维数是p,它们构成了可观测的微观状态,我们假设不存在未观测变量。一个粗粒化策略 <math>ϕ: R_p → R_q</math> ,其中 <math>q ≤ p</math>, 是宏观状态的维度,作为超参数给定;一个相应的反粗粒化策略<math>ϕ^\dagger: R_q → R_p</math>,以及一个宏观层面的马尔可夫动力学<math>f_q</math> ,使得<math>f_q</math>的有效信息(EI)值在<math>ϕ</math>、<math>f_q</math>和<math>ϕ^\dagger</math>预测的<math>x_{t+1}</math>接近于<math>x_{t+1}</math>的实际数据的约束下最大化。它们的关系用方程1表示为: | | 假设复杂动态系统的行为数据是时间序列 <math>\{x_t\}</math>,时间步长<math>t = 1,2,…, T</math>,维数是p,它们构成了可观测的微观状态,我们假设不存在未观测变量。一个粗粒化策略 <math>ϕ: R_p → R_q</math> ,其中 <math>q ≤ p</math>, 是宏观状态的维度,作为超参数给定;一个相应的反粗粒化策略<math>ϕ^\dagger: R_q → R_p</math>,以及一个宏观层面的马尔可夫动力学<math>f_q</math> ,使得<math>f_q</math>的有效信息(EI)值在<math>ϕ</math>、<math>f_q</math>和<math>ϕ^\dagger</math>预测的<math>x_{t+1}</math>接近于<math>x_{t+1}</math>的实际数据的约束下最大化。它们的关系用方程1表示为: |
| | | |
− | {{NumBlk|:|
| + | <math>\begin{aligned}&\max_{\phi,f_{q},\phi^{+}}\mathcal{J}(f_{q}),\\&s.t.\begin{cases}\parallel\hat{x}_{t+1}-x_{t+1}\parallel<\epsilon,\\\hat{x}_{t+1}=\phi^{\dagger}\left(f_{q}(\phi(x_{t})\bigr)\right).\end{cases}\end{aligned}</math> |
− | <math> | |
− | \begin{aligned}&\max_{\phi,f_{q},\phi^{+}}\mathcal{J}(f_{q}),\\&s.t.\begin{cases}\parallel\hat{x}_{t+1}-x_{t+1}\parallel<\epsilon,\\\hat{x}_{t+1}=\phi^{\dagger}\left(f_{q}(\phi(x_{t})\bigr)\right).\end{cases}\end{aligned} | |
− | </math> | |
− | |{{EquationRef|1}}}}
| |
| | | |
| NIS使用神经网络对方程1中所有需要优化的函数进行参数化,其中粗粒度函数<math>ϕ</math>和反粗粒度函数<math>ϕ^\dagger</math>分别称为编码器和解码器,宏观动力学函数fq称为动态学习器。其次考虑到<math>ϕ</math>和<math>ϕ^\dagger</math>之间的对称位置,使用采用RealNVP框架的可逆神经网络来降低模型复杂性,并使数学分析成为可能。具体如下: | | NIS使用神经网络对方程1中所有需要优化的函数进行参数化,其中粗粒度函数<math>ϕ</math>和反粗粒度函数<math>ϕ^\dagger</math>分别称为编码器和解码器,宏观动力学函数fq称为动态学习器。其次考虑到<math>ϕ</math>和<math>ϕ^\dagger</math>之间的对称位置,使用采用RealNVP框架的可逆神经网络来降低模型复杂性,并使数学分析成为可能。具体如下: |
第121行: |
第117行: |
| | | |
| 具体计算公式如下所示: | | 具体计算公式如下所示: |
− |
| |
− |
| |
| <math>\max_{\phi_q,\hat{f}_{\phi_q},\phi_q^†,q} \mathcal{I}(\hat{f}_{\phi_q})</math> | | <math>\max_{\phi_q,\hat{f}_{\phi_q},\phi_q^†,q} \mathcal{I}(\hat{f}_{\phi_q})</math> |
| | | |
| <math>\text{s.t.}\left\|\phi_q^{\dagger}(Y(t+1))-X_{t+1}\right\|<\epsilon </math> | | <math>\text{s.t.}\left\|\phi_q^{\dagger}(Y(t+1))-X_{t+1}\right\|<\epsilon </math> |
− |
| |
− |
| |
| | | |
| 最终希望得到有效的粗粒化维度<math>q </math>、粗粒化策略<math>\mathrm{\phi}_q </math>和宏观动力学<math>{\hat{f}}_{\mathrm{\phi}_q} </math>。 | | 最终希望得到有效的粗粒化维度<math>q </math>、粗粒化策略<math>\mathrm{\phi}_q </math>和宏观动力学<math>{\hat{f}}_{\mathrm{\phi}_q} </math>。 |