第344行: |
第344行: |
| | | |
| ====NIS+==== | | ====NIS+==== |
− | 但是该方法存在一些不足,作者将优化过程分为两个阶段,但是没有真正的最大化有效信息,即公式{{EquationNote|1}}。因此,[[杨明哲]]等人<ref name=":6" />进一步改进该方法,通过引入反向动力学以及[[重加权技术]]借助[[变分不等式]]将原始的最大化有效信息转换成最大化其变分下界来直接优化目标函数。目标函数可以被定义为在给定微观预测足够小的情况下最大化宏观动力学的有效信息: | + | 但是该方法存在一些不足,作者将优化过程分为两个阶段,但是没有真正的最大化有效信息,即公式{{EquationNote|1}}。因此,[[杨明哲]]等人<ref name=":6" />进一步改进该方法,通过引入反向动力学以及[[重加权技术]]借助[[变分不等式]]将原始的最大化有效信息转换成最大化其变分下界来直接优化目标函数。具体地,根据变分不等式和[[逆概率加权]]方法,公式{{EquationNote|1}}所给出的带约束的优化问题可以转变为如下不带约束的最小化问题: |
− | | |
− | {{NumBlk|:| | |
− | <math>
| |
− | \begin{aligned}&\max_{\phi,f_{q},\phi^{\dagger}}\mathcal{J}(f_{q}),\\&s.t.\begin{cases}\parallel\hat{x}_{t+1}-x_{t+1}\parallel<\epsilon,\\\hat{x}_{t+1}=\phi^{\dagger}\left(f_{q}(\phi(x_{t})\bigr)\right).\end{cases}\end{aligned}
| |
− | </math>
| |
− | |{{EquationRef|1}}}}
| |
− | | |
− | 将最大化问题转化为带有约束的最小化问题:
| |
| | | |
| <math>\min_{\omega,\theta,\theta'} \sum_{i=0}^{T-1}w(\boldsymbol{x}_t)||\boldsymbol{y}_t-g_{\theta'}(\boldsymbol{y}_{t+1})||+\lambda|| \hat{\boldsymbol{x}}_{t+1}-\boldsymbol{x}_{t+1} ||</math> | | <math>\min_{\omega,\theta,\theta'} \sum_{i=0}^{T-1}w(\boldsymbol{x}_t)||\boldsymbol{y}_t-g_{\theta'}(\boldsymbol{y}_{t+1})||+\lambda|| \hat{\boldsymbol{x}}_{t+1}-\boldsymbol{x}_{t+1} ||</math> |
第363行: |
第355行: |
| | | |
| [[文件:NIS+.png|居中|600x600像素|替代=NIS模型框架图|NIS+模型框架图|缩略图]] | | [[文件:NIS+.png|居中|600x600像素|替代=NIS模型框架图|NIS+模型框架图|缩略图]] |
− | 文章对不同的动力学系统进行了实验,包括[[SIR动力学]]、[[Boids模型]]、[[生命游戏]]以及[[脑神经系统]]模型,这里我们选择鸟群和脑实验进行分析。
| |
| | | |
− | 下图为NIS+学习Boids模型的群集行为的实验结果。(a)和(e)给出了不同条件下鸟群的实际和预测轨迹。具体来说,作者将鸟群分为两个组,并且比较了在不同内在噪声水平(<math>\alpha</math>分别为0.001和0.4)下的多步预测结果,在噪音比较小时预测很好,在噪音比较大时预测曲线会发散。(b)展示了多步预测的平均绝对误差(MAE)随着半径r的增加而逐渐上升。(c)展示了不同尺度(q)下的<math>\Delta J</math>与预测误差(MAE)随着训练epoch的变化,发现在q=8时因果涌现最显著。(d)为归因显著性图,直观地描述了每个宏观维度与每只鸟的空间坐标之间的关联。这里用橙色点突出了每个宏观状态维度中最重要值所对应的微观状态,这些值是使用模型的[[积分梯度(IG)]]方法确定的。横轴表示16个物体在微观状态下的x和y坐标,纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体的坐标,而蓝色实线分隔了两个鸟群。(f)和(g)表示不同噪声水平下<math>\Delta J</math>和归一化MAE的变化,(f)表示外部噪声的变化(即观测噪音加入到微观数据), (g)表示内在噪声(用<math>\alpha</math>表示,通过修改Boids模型的动力学加入)。在(f)和(g)中,水平线表示违反误差约束的阈值。当归一化MAE大于阈值0.3时,违反约束,结果不可靠。
| |
| | | |
− | [[NIS+]]可以通过最大化EI来学习宏观状态和粗粒化策略。这种最大化增强了模型对超出训练数据范围情况的泛化能力。学习到的宏观状态有效地识别了平均[[群体行为]],并且可以使用IG方法将其归因于个体位置。此外,CE的程度随外在噪声的增加而增加,而随内在噪声的减少而减少。这一观察结果表明,通过粗粒化可以消除外在噪声,而内在噪声则不能。 | + | 文章对不同的时间序列数据集上进行了实验,包括动力系统模型[[SIR动力学]]、鸟群模型([[Boids模型]])和元胞自动机:[[生命游戏]]所生成的数据,以及人类被试的[[脑神经系统]]fMRI信号真实的数据,这里我们选择鸟群和脑信号分别实验进行分析。 |
| + | |
| + | 下图为NIS+学习Boids模型的群集行为的实验结果。(a)和(e)给出了不同条件下鸟群的实际和预测轨迹。具体来说,作者将鸟群分为两个组,并且比较了在不同噪声水平(<math>\alpha</math>分别为0.001和0.4)下的多步预测结果,在噪音比较小时预测很好,在噪音比较大时预测曲线会发散。(b)展示了多步预测的平均绝对误差(MAE)随着半径r的增加而逐渐上升。(c)展示了不同维度(q)下的[[因果涌现度量]]<math>\Delta J</math>与预测误差(MAE)随着训练epoch的变化,作者发现在q=8时因果涌现最显著。(d)为归因显著性图,直观地描述了每个宏观维度与每只鸟的空间坐标(微观维度)之间的关联,颜色越深关联度越高。这里用橙色点突出了每个宏观状态维度中最大关联值所对应的微观状态,这些值是使用模型的[[积分梯度(IG)]]方法确定的。横轴表示16个物体在微观状态下的x和y坐标,纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体Boid的坐标,而蓝色实线分隔了两个鸟群。(f)和(g)表示不同噪声水平下<math>\Delta J</math>和归一化MAE的变化,(f)表示外部噪声的变化(即观测噪音加入到微观数据), (g)表示内在噪声(用<math>\alpha</math>表示,通过修改Boids模型的动力学加入)。在(f)和(g)中,水平线表示违反公式{{EquationNote|1}}中误差约束的阈值。当归一化MAE大于阈值0.3时,违反约束,结果不可靠。 |
| + | |
| + | 这组实验表明,[[NIS+]]可以通过最大化EI来学习宏观状态和粗粒化策略。这种最大化增强了模型对超出训练数据范围情况的泛化能力。学习到的宏观状态有效地识别了平均[[群体行为]],并且可以使用梯度积分方法将其归因于个体位置。此外,因果涌现的程度随外在噪声的增加而增加,而随内在噪声的减少而减少。这一观察结果表明,通过粗粒化可以消除外在噪声,而不能削减内在噪声。 |
| | | |
| [[文件:NIS+ boids.png|居中|600x600像素|缩略图|鸟群中的因果涌现]] | | [[文件:NIS+ boids.png|居中|600x600像素|缩略图|鸟群中的因果涌现]] |
| | | |
− | 脑实验基于FMRI数据,选择人的静息态和看电影视觉任务,由于原始维度比较高,首先通过使用[[Schaefer atlas]]方法对原始的14000维数据降维到100个脑区,构建了6个尺度动力学,图a展示了不同尺度下的多步预测误差,图b展示了在静息态和看电影视觉任务中NIS与NIS+方法的对比,在视觉任务数据中发现scale=1时因果涌现最显著,通过归因分析发现视觉区发挥的作用最大(图c),与真实的场景保持一致,图d展示了脑区归因的不同视角图。
| + | 脑实验是基于FMRI数据,对830个人类被试做了两组实验,第一组是让他们执行看一段电影短片的视觉任务,第二组实验是让他们处于静息态下。由于原始维度比较高,作者们首先通过使用[[Schaefer atlas]]方法对原始的14000维数据降维到100个维度,每个维度对应一个脑区。之后,作者们通过NIS+学习这些数据,并提炼出6个不同宏观尺度下的动力学,图a展示了不同尺度下的多步预测误差结果,图b展示了在静息态和看电影视觉任务中NIS与NIS+方法在不同宏观维度上EI的对比。作者们发现在视觉任务数据中,维度q=1时因果涌现最显著,通过归因分析发现视觉区发挥的作用最大(图c),与真实的场景保持一致,图d展示了脑区归因的不同视角图。而在静息态下,1个宏观维度不足以预测微观时间序列数据,因果涌现最大的维度是表现在3-7维之间。 |
| [[文件:NIS+ 脑数据.png|居中|600x600像素|缩略图|脑神经系统中的因果涌现]] | | [[文件:NIS+ 脑数据.png|居中|600x600像素|缩略图|脑神经系统中的因果涌现]] |
| + | |
| + | 这些实验表面NIS+不仅可以辨识数据中的因果涌现、发现涌现的宏观动力学和粗粒化策略,而且还能够通过EI最大化而增加模型的分布外泛化能力。 |
| | | |
| ==应用== | | ==应用== |