更改

添加192字节 、 2024年9月26日 (星期四)
无编辑摘要
第191行: 第191行:     
其中,<math>\boldsymbol{\xi}_1,\boldsymbol{\xi}_2 \sim \scriptsize{N}(0,\Sigma) </math>为相互独立的二维高斯噪声,<math>\Sigma </math>为相关矩阵。微观状态序列<math>\boldsymbol{x}_t = (\boldsymbol{S}'_t,\boldsymbol{I}'_t) </math>作为训练样本。作者在图(a)的三角形区域内采样,以此来随机选择初始条件,并使用上述过程生成时间序列数据,用以训练模型。
 
其中,<math>\boldsymbol{\xi}_1,\boldsymbol{\xi}_2 \sim \scriptsize{N}(0,\Sigma) </math>为相互独立的二维高斯噪声,<math>\Sigma </math>为相关矩阵。微观状态序列<math>\boldsymbol{x}_t = (\boldsymbol{S}'_t,\boldsymbol{I}'_t) </math>作为训练样本。作者在图(a)的三角形区域内采样,以此来随机选择初始条件,并使用上述过程生成时间序列数据,用以训练模型。
 +
[[文件:Sir1.jpg|左|无框]]
 +
 +
 +
 +
 +
 +
 +
 +
   −
[[文件:NIS+_sir.jpg|替代=|无框|800x800像素]]
      
====NIS+识别[[因果涌现]]的能力====
 
====NIS+识别[[因果涌现]]的能力====
    
首先,为了确保[[有效信息|EI]]被NIS+最大化,作者绘制相应图形,观察维度平均的[[有效信息]](J)在训练时期的演变。
 
首先,为了确保[[有效信息|EI]]被NIS+最大化,作者绘制相应图形,观察维度平均的[[有效信息]](J)在训练时期的演变。
 +
[[文件:Sir1 - 副本.jpg|左|无框]]
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
    
结果表明(图(b)),NIS+(红色实线)、[[NIS]](黑色虚线)和VAE+(绿色实线)的曲线呈上升趋势,但NIS+的增长速度更快。这表明NIS+比其他模型更能有效地最大化J。值得注意的是,[[NIS]]也表现出EI的自然增长,因为它逐渐使预测误差最小化。
 
结果表明(图(b)),NIS+(红色实线)、[[NIS]](黑色虚线)和VAE+(绿色实线)的曲线呈上升趋势,但NIS+的增长速度更快。这表明NIS+比其他模型更能有效地最大化J。值得注意的是,[[NIS]]也表现出EI的自然增长,因为它逐渐使预测误差最小化。
    
其次,为了检验NIS+检测和识别因果涌现的能力,图(e)展示了随着噪音的增大,因果涌现强度<math>\Delta\mathcal{J} </math>的变化趋势,并将其与[[Rosas的因果涌现度量]]<math>\Psi </math>指标进行了比较(为了让<math>\Psi </math>可计算,作者利用从NIS+中学习到的宏观状态来作为[math]\Psi[/math]计算中的宏观变量。结果用图(e)中的黑色和黄色实线表示。
 
其次,为了检验NIS+检测和识别因果涌现的能力,图(e)展示了随着噪音的增大,因果涌现强度<math>\Delta\mathcal{J} </math>的变化趋势,并将其与[[Rosas的因果涌现度量]]<math>\Psi </math>指标进行了比较(为了让<math>\Psi </math>可计算,作者利用从NIS+中学习到的宏观状态来作为[math]\Psi[/math]计算中的宏观变量。结果用图(e)中的黑色和黄色实线表示。
 +
[[文件:Sir1 - 副本 (3).jpg|左|无框]]
 +
 +
 +
 +
 +
 +
 +
 +
    
结果表明(图(e)),当噪音水平<math>σ <0.01 </math>时,<math>\Delta\mathcal{J}>0 </math>始终保持不变,这表明,NIS+方法认为在低噪声水平[[因果涌现]]始终发生,而因为<math>\sigma=10^{-3} </math>后,<math>\Psi>0 </math>,这表明Rosas的方法认为因果涌现始终发生。NIS+的结果更合理,因为它可以从有噪声的数据中提取出类似于真实宏观机制的宏观动力学,并且这种确定性动力学应该比有噪声的微观动力学具有更大的EI。作者还分别绘制了宏观和微观动力学的EI曲线<math>J(f_M) </math>(红色虚线)和<math>J(f_m) </math>(绿色虚线)。这些曲线随着σ的增大而减小,但<math>J(f_m) </math>的减小速度更快,导致观测到[[因果涌现]]的发生。但是,当<math>\Psi<0 </math>时,因为Ψ只能为[[因果涌现]]提供充分条件,作者不能做出明确的判断。这两个指标在<math>\sigma=10^{-2} </math>处达到峰值,这与作者模拟中使用的时间步长(<math>dt=0.01 </math>)的大小相对应,反映了微观状态的变化水平。另一方面,如果噪声过大,有限的观测数据将使NIS+难以从数据中准确识别正确的宏观动力学。因此,[[因果涌现|CE]]的程度降至零。虽然NIS+判定<math>σ > 10 </math>时不存在[[因果涌现]],但这一结果并不可靠,因为<math>\sigma=10^{-2} </math>后的归一化预测误差已经超过了所选阈值0.3(垂直虚线和虚线)。
 
结果表明(图(e)),当噪音水平<math>σ <0.01 </math>时,<math>\Delta\mathcal{J}>0 </math>始终保持不变,这表明,NIS+方法认为在低噪声水平[[因果涌现]]始终发生,而因为<math>\sigma=10^{-3} </math>后,<math>\Psi>0 </math>,这表明Rosas的方法认为因果涌现始终发生。NIS+的结果更合理,因为它可以从有噪声的数据中提取出类似于真实宏观机制的宏观动力学,并且这种确定性动力学应该比有噪声的微观动力学具有更大的EI。作者还分别绘制了宏观和微观动力学的EI曲线<math>J(f_M) </math>(红色虚线)和<math>J(f_m) </math>(绿色虚线)。这些曲线随着σ的增大而减小,但<math>J(f_m) </math>的减小速度更快,导致观测到[[因果涌现]]的发生。但是,当<math>\Psi<0 </math>时,因为Ψ只能为[[因果涌现]]提供充分条件,作者不能做出明确的判断。这两个指标在<math>\sigma=10^{-2} </math>处达到峰值,这与作者模拟中使用的时间步长(<math>dt=0.01 </math>)的大小相对应,反映了微观状态的变化水平。另一方面,如果噪声过大,有限的观测数据将使NIS+难以从数据中准确识别正确的宏观动力学。因此,[[因果涌现|CE]]的程度降至零。虽然NIS+判定<math>σ > 10 </math>时不存在[[因果涌现]],但这一结果并不可靠,因为<math>\sigma=10^{-2} </math>后的归一化预测误差已经超过了所选阈值0.3(垂直虚线和虚线)。
第209行: 第237行:     
在单独的测试数据集上预测多个时间步(10步)的未来状态,以比较NIS+与其他模型的预测未来状态的能力。之后,以图(a)中带点区域为训练数据集,即<math>\frac{1}{3} ≤ S ≤ 1 </math>的部分。以图(a)中整个蓝色三角形为测试数据集,即<math>0 ≤ S ≤ 1 </math>的部分。这样训练NIS+的时候不会用到<math>0 ≤ S ≤ \frac{1}{3} </math>的数据,但是测试NIS+的时候会用到<math>0 ≤ S ≤ \frac{1}{3} </math>的数据,可以通过测试<math>0 ≤ S ≤ \frac{1}{3} </math>的数据的误差大小来比较各个模型的泛化能力。
 
在单独的测试数据集上预测多个时间步(10步)的未来状态,以比较NIS+与其他模型的预测未来状态的能力。之后,以图(a)中带点区域为训练数据集,即<math>\frac{1}{3} ≤ S ≤ 1 </math>的部分。以图(a)中整个蓝色三角形为测试数据集,即<math>0 ≤ S ≤ 1 </math>的部分。这样训练NIS+的时候不会用到<math>0 ≤ S ≤ \frac{1}{3} </math>的数据,但是测试NIS+的时候会用到<math>0 ≤ S ≤ \frac{1}{3} </math>的数据,可以通过测试<math>0 ≤ S ≤ \frac{1}{3} </math>的数据的误差大小来比较各个模型的泛化能力。
 +
[[文件:Sir1 - 副本 (4).jpg|左|无框]]
 +
 +
 +
 +
 +
 +
 +
 +
    
结果表明(图(d)),NIS+和[[NIS]]在整体数据集上(绿色条)表现优于其他模型(NN、NN+、VAE、VAE+)。这说明在编码器和解码器中使用[[可逆神经网络]]会更好。NIS+的分布外泛化能力优于其他模型,在部分数据集上,不同模型之间的差异较大。
 
结果表明(图(d)),NIS+和[[NIS]]在整体数据集上(绿色条)表现优于其他模型(NN、NN+、VAE、VAE+)。这说明在编码器和解码器中使用[[可逆神经网络]]会更好。NIS+的分布外泛化能力优于其他模型,在部分数据集上,不同模型之间的差异较大。
第215行: 第252行:     
将真实的[[SIR]]动力学的向量场(<math>d\boldsymbol{y}/dt </math>)(红色)、基于编码器的雅可比矩阵得到的理论向量(蓝色)与通过模型学习到的宏观动态的向量(<math>d(h_1,h_2)/dt </math>)(绿色)进行比较。
 
将真实的[[SIR]]动力学的向量场(<math>d\boldsymbol{y}/dt </math>)(红色)、基于编码器的雅可比矩阵得到的理论向量(蓝色)与通过模型学习到的宏观动态的向量(<math>d(h_1,h_2)/dt </math>)(绿色)进行比较。
 +
[[文件:Sir1 - 副本 (5).jpg|左|无框]]
 +
 +
 +
 +
 +
 +
 +
 +
    
结果表明(图(c)表示NIS+,图(f)表示[[NIS]]),学习到的向量与真实向量对齐及理论向量(用雅可比矩阵计算)对齐。NIS+明显优于[[NIS]],尤其是在没有训练样本的外围区域。
 
结果表明(图(c)表示NIS+,图(f)表示[[NIS]]),学习到的向量与真实向量对齐及理论向量(用雅可比矩阵计算)对齐。NIS+明显优于[[NIS]],尤其是在没有训练样本的外围区域。
259

个编辑