更改

NIS+ (查看源代码)

2024年8月22日 (四) 01:27的版本

添加6,762字节、 2024年8月22日 (星期四)

无编辑摘要

第534行：第534行：

27 July - 1 August 1987.</ref><ref>Reynolds C-W. Flocks, herds and schools: A distributed behavioral model. Proceedings of the 14th annual conference on Computer graphics and interactive techniques, Denver,

−

27 July - 1 August 1987.</ref>。此实验有两个基本目标：①评估在具有内在和外在噪声的不同环境下捕获涌现现象和CE量化的能力，②试图给出学习到的宏观状态和微观状态之间的显式对应关系，以此来提高训练粗粒度策略的可解释性。

+

27 July - 1 August 1987.</ref>。此实验有两个基本目标：①评估在具有内在和外在噪声的不同环境下捕获涌现现象和CE量化的能力，②试图给出学习到的宏观状态和微观状态之间的显式对应关系，以此来提高训练粗粒度策略的可解释性，③模型的泛化能力。

我们根据Reynolds(1987)<ref name=":5" />的方法模拟Boids模型，在300 × 300的画布上用N = 16个鸟生成训练数据。为了评估NIS+发现有意义的宏观状态的能力，我们将鸟群分为两组，并为每组引入不同的恒定转向力。这一修改确保了两组分别沿着不同转弯角度的轨迹运动，如图(a)所示。我们通过模拟生成训练和测试数据。在每个时间步长t上，微状态生成为4N维向量：

第542行：第542行：

其中<math>(x_i^t,y_i^t) </math>是位置，<math>(v_{x,i}^t,v_{y,i}^t) </math>是时刻t的速度，<math>i=1,2,\dots,16 </math>。

−

如图4a中的三角形所示，预测的50步紧急集体飞行行为与两组的地面真实轨迹密切相关，特别是在初始阶段。这些预测轨迹是通过将预测的宏观状态解码为相应的微观状态来生成的，两条实线表示它们的平均值。

+

[[文件:NIS+ boid.png|NIS+ boid|500x500px|替代=|右|无框]]

−

~~根据观察到CE在q = 8时始终达到最大值，如图4c所示，本实验选择超参数q = 8，即宏观变量的维度。~~

+

一、识别因果涌现。

−

如图4a中的三角形所示，预测的50步紧急集体飞行行为与两组的地面真实轨迹密切相关，特别是在初始阶段。这些预测轨迹是通过将预测的宏观状态解码为相应的微观状态来生成的，两条实线表示它们的平均值。

+

实验结果表明（图(a)），预测的涌现集体飞行行为（50步）与两组的真实轨迹密切相关，特别是在初始阶段。这些预测轨迹是通过将预测的宏观状态解码为相应的微观状态来生成的，两条实线表示它们的平均值。

−

~~根据观察到CE在q~~ = ~~8时始终达到最大值，如图4c所示，本实验选择超参数q~~ = ~~8，即宏观变量的维度。~~

+

根据观察，CE在q = 8时达到最大值，如图(c)所示，这与本实验选择超参数q = 8（宏观变量的维度）相符。

−

为了增强NIS+中习得的宏观状态和粗粒度函数的可解释性，我们利用集成梯度(IG)方法[47](见支持信息3.3节)来识别每个习得的紧急宏观状态维度中最重要的微观状态。我们将计算的IG归一化，并在每个宏观状态中增强微观状态的最大梯度，忽略每个物体的速度尺寸，因为它们与宏观状态的相关性较低。归一化IG绘制成矩阵图(图4d)。如图4d所示，宏观状态的第1、2、5、6维分别对应第一组(ID<8)中的ID，第3、4、7、8维对应第二组(ID>=8)中的ID。因此，学习到的粗粒度策略使用两个位置坐标来表示所有其他信息，形成一个维度的宏观状态。对于宏观状态，我们需要注意，对于一群鸟，需要两个坐标相关的维度和两个速度相关的维度来描述它们的运动状态。所以两组鸟需要八个维度。我们可以推测有一只鸟作为这群鸟的代表，观察这只鸟的情况可以预测这群鸟的整体运动趋势。然后我们利用两倍的位置维度来进行预测。除了表示位置的两个维度外，速度还可以由两个连续时刻之间的位置差导出。然而，一次只能输入来自单个时刻的信息，这就需要额外的自由度来表示速度。因此，我们仍然需要八个自由度来描述两组鸟的宏观状态

+

二、尝试解释此模型得到的宏观与微观的显式对应关系。

−

为了比较NIS+和NIS的学习和预测效果，我们通过测试它们在不同于训练数据集的初始条件下的性能来评估它们的泛化能力。在生成训练数据的仿真过程中，所有体的位置被约束在一个半径为r的圆内，如图4a所示。然而，当初始位置位于较大的圆上时，我们评估了两种模型的预测能力。图4b显示了NIS+和NIS的MAEs，其随半径r的增加而增加，其中预测误差越小，泛化越好。结果清楚地表明，与NIS相比，NIS+在所有测试半径r上具有优越的泛化性

+

我们利用积分梯度(IG)方法<ref name=":6">Sundararajan M, Taly A and Yan Q. Axiomatic attribution for deep networks. Proceedings of the 34th International Conference on Machine Learning, Sydney, 6-11 August

−

此外，为了研究内在扰动和观测扰动对CE的影响，引入了两种类型的噪声。通过在每个时间步长为每个物体增加随机转角，将固有噪声纳入该规则。这些角度均匀分布在区间α·[−π， π]内，其中α∈[0,1]是控制本振噪声大小的参数。另一方面，假定外部噪声会影响观测的微观状态。在这种情况下，我们假设不能直接观察到每个物体的微观状态，而是获得有噪声的数据。外部或观测噪声δ ~ N (0， δmax)被添加到微观状态中，δmax是决定该噪声水平的参数。

+

2017.</ref>来识别每个学到的涌现宏观状态维度中最重要的微观状态。我们将计算的IG归一化，并在每个宏观状态中增强微观状态的最大梯度，并且忽略每只鸟的速度维度，因为它们与宏观状态的相关性较低。将归一化的IG绘制成矩阵图。

−

结果如图4f和4g所示，在这两种情况下，归一化MAE都增加了，这表明随着内在和外在噪声的增加，预测任务更具挑战性。然而，这两种类型的噪声之间的差异可以通过检查CE(∆J)~~的程度来观察。从图4f可以看出，∆J随外部噪声(δmax)的增大而增大，说明粗粒化可以在一定范围内减轻噪声，增强因果效应。δmax~~ < 0.1时，归一化MAE小于0.3(黑色虚线)，满足式1的约束。在这种情况下，CE的程度随着δmax的增大而增大。然而，当超过0.3的阈值时，即使∆J减小，我们也无法得出有意义的结论，因为违反了方程1中的约束，结果的可靠性就会降低

+

实验结果表明（图(d)），宏观状态的第1、2、5、6维分别对应第一组中的ID（ID<8），第3、4、7、8维对应第二组中的ID（ID>=8）。因此，学习到的粗粒度策略使用两个位置坐标来表示所有其他信息，形成一个维度的宏观状态。对于宏观状态，我们需要注意，对于一群鸟，需要两个坐标相关的维度和两个速度相关的维度来描述它们的运动状态。所以两组鸟需要八个维度。我们可以推测有一只鸟作为这群鸟的代表，观察这只鸟的情况可以预测这群鸟的整体运动趋势。然后我们利用两个位置维度来进行预测。除了表示位置的两个维度外，速度还可以由两个连续时刻之间的位置差导出。然而，一次只能输入来自单个时刻的信息，这就需要额外的自由度来表示速度。因此，我们仍然需要八个自由度来描述两组鸟的宏观状态。

−

另一方面，图4g表明，∆J随着本振噪声(α)水平的增加而减小。这可以归因于宏观层面的动态学习者试图在这一阶段捕捉每个群体的群集行为。然而，随着本征噪声的增加，蜂群行为逐渐减弱，导致CE降低。我们没有包括α > 0.6的情况，因为归一化MAE超过0.3的阈值，违反了方程1中的约束。图4e显示了α = 0.4的随机偏转角噪声的真实轨迹和预测。可以观察到，在早期可以预测直线趋势，但随着噪声引起的偏差逐渐增大，误差也随之增大，这直观地反映了CE的降低。为了进行比较，我们还对Ψ测试了相同的曲线，结果显示在支持信息第6节中，因为所有的值都是负的，而且幅度很大。

+

三、泛化能力。

−

~~这些实验证明了NIS+识别突发性集体行为的能力，以及噪声对突发性集体行为的影响程度。~~

+

在生成训练数据的仿真过程中，所有鸟的位置被约束在一个半径为r的圆内，如图(a)所示。我们评估当初始位置位于较大的圆上时两种模型的预测能力。

+

实验结果表明（图(b)），NIS+和NIS的MAE值随半径r的增加而增加，而预测误差MAE越小，泛化能力越好。结果清楚地表明，与NIS相比，NIS+在所有测试半径r上具有优越的泛化能力。

−

在300×300画布上使用N = 16个boids进行模拟以生成训练数据。为了评估NIS+发现有意义的宏观状态的能力，我们将所有boids分为两组，并人为地修改boids模型，为每组引入不同的恒定转向力。这种修改确保了两组具有不同转弯角度的独立轨迹。每个物体在每个时间步长的微观状态包括它们的水平和垂直位置，以及它们的二维速度。所有生物的微观状态形成一个4N维实数向量，作为训练NIS+的输入。

+

四、内在噪音和外部噪音对CE的影响。

−

[[~~文件:NIS+ boid.png|NIS+ boid|缩略图|462x462px|替代=|居中]~~]

+

通过在每个时间步长为每只鸟增加随机转角，引入内在噪声。这些角度均匀分布在区间<math>\alpha\cdot [-\pi,\pi] </math>内，其中<math>\alpha\in[0,1] </math>是控制内在噪声大小的参数。另一方面，假定外部噪声会影响观测的微观状态。在这种情况下，我们假设不能直接观察到每个物体的微观状态，而是获得有噪声的数据。将外部或观测噪声<math>\delta\sim \mathcal{N}(0,\delta_{max}) </math>添加到微观状态中，<math>\delta_{max} </math>是决定该噪声水平的参数。

−

~~上图为NIS+学习Boids模型的集体群集行为的实验结果。~~(a)和(e)~~给出了各种条件下星体轨迹的实际和预测数据。具体来说，他们给出了在两个分离组和随机偏转角度条件下的多步~~(~~50步~~)~~预测的比较结果。它们的本征噪声水平α分别为0.001和0.4。~~(b)~~展示了多步预测的平均绝对误差~~(~~MAE~~)~~的上升，因为半径r(表示~~(a)~~中物体的初始位置范围)超出了训练数据的限制。~~(c)~~用不同的q超参数~~(~~代表不同宏观状态的尺度~~)~~描述了NIS+的训练时代中维度平均因果出现~~(∆J)的变化趋势。(d)为显著性图，直观地描述了每个宏观维度与每个体的空间坐标之间的关联。我们用橙色点突出了每个宏观状态维度中最重要的对应微观状态，这些微观状态是使用应用于模型的积分梯度(IG)方法确定的。横轴表示16个物体在微观状态下的x和y坐标，纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体体的坐标，而钢蓝色的实线分隔了实体组。

+

实验结果表明（图(f)和图(g)），在这两种情况下，归一化MAE都增加了，这表明随着内在和外在噪声的增加，预测任务更具挑战性。然而，这两种类型的噪声之间的差异可以通过检查CE(<math>\Delta{J}>0 </math>)的程度来观察。从图(f)可以看出，<math>\Delta{J}>0 </math>随外部噪声(<math>\delta_{max} </math>)的增大而增大，说明粗粒化可以在一定范围内减轻噪声，增强因果效应。<math>\delta_{max}<0.1 </math>时，归一化MAE小于0.3(黑色虚线)，满足式{{EquationNote|1}}的约束。在这种情况下，CE的程度随着<math>\delta_{max} </math>的增大而增大。然而，当超过0.3的阈值时，即使<math>\Delta{J}>0 </math>减小，我们也无法得出有意义的结论（违反了式{{EquationNote|1}}中的约束），结果的可靠性就会降低。从图(g)可以看出，<math>\Delta{J}>0 </math>随着内部噪声(α)水平的增加而减小。这是由于宏观层面的动态学习器试图在这一阶段捕捉每个群体的群体行为。然而，随着内部噪声的增加，群体行为逐渐减弱，导致CE降低。因为归一化MAE超过0.3的阈值时违反了式{{EquationNote|1}}中的约束，我们没有包括<math>\alpha>0.6 </math>的情况。图(e)显示了随机偏转角噪声<math>\alpha=0.4 </math>时候的真实轨迹和预测。可以观察到，在早期可以预测直线趋势，但随着噪声引起的偏差逐渐增大，误差也随之增大，CE降低。

−

(f)和(g)表示不同噪声水平下∆J和归一化MAE的变化，(f)表示外部噪声(观测，加入微观状态)(δmax)， (g)表示本征噪声(α，通过修改Boids模型的动力学规则加入)。在(f)和(g)中，水平线表示违反式1中误差约束的阈值。当归一化MAE大于阈值0.3时，违反约束，结果不可靠。

+

综上可知，NIS+具有识别涌现集体行为和噪声对涌现集体行为的影响程度的能力。

−

NIS+可以通过最大化EI来学习最优宏观动态和粗粒度策略。这种最大化增强了它对超出训练数据范围的情况的泛化能力。学习到的宏观状态有效地识别了平均群体行为，并且可以使用IG方法将其归因于个体位置。此外，CE的程度随外在噪声的增加而增加，而随内在噪声的减少而减少。这一观察结果表明，通过粗粒化可以消除外在噪声，而内在噪声则不能。

+

NIS+可以学习最优宏观动态和粗粒度策略，具有良好的泛化能力。学习到的宏观状态有效地识别了平均群体行为，并且可以使用IG方法将其归因于个体位置。此外，CE的程度随外在噪声的增加而增加，随内在噪声的增大而减少。这一观察结果表明，通过粗粒化可以消除外在噪声，而不能消除内在噪声。

== 生命游戏模型实验 ==

+

Conway’s Game of Life是一个著名的二维元胞自动机模型，在这个模型上出现了滑翔机、正方形、花朵、信号灯、蜂窝、交通灯等各种有趣的动态模式。与SIR模型和Boids模型不同的是，Game of Life在每个时间步长的微观状态在一个大的规则网格上是离散的(0或1)，如图10所示。此外，微动力学不能用微分方程或差分方程来表示，而是用规则表来表示(详情可参阅7.1节的支持信息)。

+

我们使用随机初始条件下Game of Life模拟生成的数据来训练NIS+，提取从第100步到第120步的状态时间序列。图10(a)、(b)和(c)显示了由ground truth模拟(第一行)和NIS+预测(第三行)生成的动态模式，以及可以进行这些预测的紧急宏观状态(第二行)。我们将两个时间步长连续的图像输入到NIS+中，再用两个时间步长连续得到另一个图像对。把上面的图片和下面的图片比较一下，图案是相似的。然而，第三列的学习和预测模式，特别是“滑翔机”模式，由于在随机初始条件下具有该模式的训练样本的出现有限，因此显得模糊。为了提高预测的质量，我们可以生成一组新的训练样本，其中包含两个“滑翔机”的初始条件。结果，预测变得更加清晰，如图10(d)所示，尽管这个测试环境中的滑翔机数量是3个。这意味着，NIS+可以捕获包括移动、静态和振荡结构在内的模式。

+

此外，我们评估了模型在不同于训练环境的测试环境中的泛化能力。我们比较了NIS和NIS+在不同于初始随机模式的8种不同模式类型下的多步预测性能。结果如图10(f)所示，表明对于所有模式类型，NIS+始终比NIS获得更高的AUC(曲线下面积)。其中，在x坐标的勾号标签中，我们采用“模式名称(数量)”的格式来表示各种初始条件。例如，“滑翔机(2)”表示包含两个滑翔机的初始配置。因此，我们提供的证据表明，增强型NIS+方法在捕获这些模式方面具有优越的泛化能力。

+

我们进一步测试CE的程度(∆J)，并使用NIS+的相同学习宏观状态变量将其与Ψ进行比较。我们使用相同的模式作为初始条件来测试比较。

+

结果如图10(g)所示，显示了CE的结果，其中每个条代表一个初始模式的∆J和Ψ的组合。关于∆J，除“随机”病例外，其余8例均发生CE。“滑翔机”型病例由于预测不良，CE程度最低(见图10(c))。其余7种模式显示相似的∆J值。这些结果表明，∆J提供了CE发生的更合理的指示，与我们的直觉一致。但是，对于Ψ，所有情况产生的值都小于或等于0。解释这一现象的一个可能原因是Ψ的近似忽略了许多冗余信息。因此，产生了不合理的结果，使得Ψ无法确定CE是否发生。因此，本文提出的∆J是一种较好的鉴别CE的方法。

+

此外，这个示例突出了NIS+的多功能性。为了进行上述实验，我们需要在空间和时间维度上对元胞自动机的微观状态进行粗粒度处理。为了应对这一挑战，我们引入了时空卷积的概念。本实验中使用的体系结构如图10(e)所示。

+

整个粗粒度过程可分为两个步骤:首先，在固定大小的窗口(本文为3x3窗口)内聚合信息，获得空间粗粒度结果;其次，将这些结果在多个连续的时间步长上聚合，形成一个时空粗糙的宏观状态。所有这些过程都是通过NIS+中的并行编码器实现的。

+

数据生成

+

本文以Conway’s Game of Life作为实验对象，其中每个细胞有两种状态作为二维状态输入:alive(1)或dead(0)，每个细胞受到八个相邻细胞的影响。生命游戏的进化只受输入状态及其更新规则的影响，其中生命游戏有四条进化规则，分别对应细胞繁殖和死亡等。Game of Life的更新规则如下表所示:Game of Life的训练样本生成过程如下:首先初始化状态xt。当考虑两个步骤的时间粗粒度时，根据更新规则生成状态xt+1、xt+2和xt+3的后续三个步骤，并将其输入到机器学习模型中。两个输入状态分别为xt和xt+1，微动力学输出分别为xt+1和xt+2。由于使用了时空粗粒度，宏观动力学将输出一个宏观状态，并将其解码为微观状态xt+2和xt+3。此过程重复多次(50,000个样本)，并生成图10d中用于训练的数据。而在其他实验中，我们生成了50万个样本。

+

[[文件:Gamelife.png|右|无框|600x600像素|1]]

+

模型对滑翔机模式的预测能力

然后，我们测试了在滑翔机模式上捕获动态模式的能力，其中模型是基于两个滑翔机模式进行训练的。该模型具有良好的预测效果，结果如图11所示。

此外，关于其他模型参数的更详细信息请参见表2。

+

[[文件:Gamelife append.png|右|无框|1]]

== 大脑fMRI 时间序列数据模型实验 ==

+

我们在830名受试者(AOMIC ID1000)的真实大脑fMRI时间序列数据上测试了我们的模型<ref name=":7">Snoek L, Miesen M and Beemsterboer T et al. The amsterdam open mri collection, a set of multimodal mri datasets for individual difference analyses. Sci Data 2021; 8: 03.</ref>。fMRI扫描数据是在受试者观看同一段电影时收集的。因此，在相似的自然刺激下，被试的相似经历是预期的，这对应于具有不同初始条件的相同动力学的时间序列。采样率(重复时间)为:ID1000为2.2s, PIOP2为2s。我们通过Schaefer atlas方法对原始数据进行预处理<ref>Schaefer A, Kong R and Gordon E-M et al. Local-Global Parcellation of the Human Cerebral Cortex from Intrinsic Functional Connectivity MRI. Cereb Cortex 2017; 28:3095–3114.</ref>，将每个受试者的时间序列维数从大约140,000(不同受试者的维数不同)降至100，使NIS+能够运行并获得更清晰的结果。然后，选取前800个时间序列数据进行训练，剩下的30个时间序列进行测试。我们还将我们的结果与另一个fMRI数据集AOMIC PIOP2[48]<ref name=":7" />进行了比较，其中50名受试者处于静息状态。关于数据集的进一步描述可以参考支持信息第8节。

+

为了证明NIS+对微观状态的预测能力，图5(a)展示了在不同的超参数q下，归一化后的MAE随着微动力学对测试数据的预测步骤的变化。显然，当q = 27和q = 1时，NIS+的预测效果更好。具体来说，随着预测步骤的增加，与q = 1的曲线相比，q = 27的曲线显示出较慢的增长率。这表明选择超参数q为27可能比选择1更合适。

+

然而，图5(b)显示了不同的结果。当比较不同超参数q(绿色条)的CE(∆J)程度时，当q = 1时观察到最高的∆J。反之，当q = 27时，∆J值为负。这表明，当q = 27时，预测结果的改善可能归因于过拟合。因此，就∆J而言，q = 1优于q的其他值。尽管观察到q = 1时∆J的标准差较大，但NIS框架(红色条形图)支持了这一发现。此外，我们还将CE的结果与静息数据进行了比较，观察到NIS(深蓝色条)和NIS+(黄色条)在q = 7处达到峰值，这正好是Schaefer atalas中子系统的数量。因此，我们可以得出这样的结论:当被试观看电影时，大脑不同区域的活动可以在每个时间步上用一个实数来表示。关于静态数据的更多分析可参考8.1节的支持信息。

+

为了研究NIS+粗粒度如何将输入数据转化为一维宏观状态，我们还利用IG方法来识别微观状态的最重要维度<ref name=":6" />。结果如图5(c)和(d)所示。我们观察到视觉(VIS)子网络表现出最高的归因(图5(c))。这些视觉子网络代表了受试者在观看电影片段时使用的功能系统。此外，我们可以在大脑地图上更详细地看到活动区域(图5(d))，其中较深的颜色表示更大程度上归因于单一宏观状态。因此，NIS+识别出的颜色相似的最深的区域，对应于大脑的深度视觉处理区域，可能代表了大脑在积极观看电影时的“协同核心”<ref>Luppi A, Mediano P and Rosas F et al. A synergistic core for human brain evolution and cognition. Nat Neurosci 2022; 25: 1–12.</ref>。这些区域的数字神经元可能协作并共同起作用。然而，通过将微观状态和宏观状态之间的相互信息分解为协同信息、冗余信息和唯一信息，还可以进一步证实和量化这一结论<ref name=":0" />。

+

总之，NIS+展示了其学习和粗粒度化来自大脑的复杂fMRI信号的能力，允许使用单个宏观状态模拟复杂的动态。如支持信息第8节所示，通过数据预处理的替代方法获得的可比结果进一步支持了我们发现的稳健性。

+

本实验在830名受试者的真实大脑fMRI时间序列数据上测试了NIS+模型。fMRI扫描数据是在受试者观看同一段电影时收集的。因此，在相似的自然刺激下，被试的相似经历是预期的，这对应于具有不同初始条件的相同动力学的时间序列。通过Schaefer atlas方法对原始数据进行预处理，将每个受试者的时间序列维数从大约140,000(不同受试者的维数不同)降至100，使NIS+能够运行并获得更清晰的结果。然后，选取前800个时间序列数据进行训练，剩下的30个时间序列进行测试。将结果与另一个fMRI数据集进行了比较，其中50名受试者处于静息状态。

第720行：第757行：

(a) SIR模型的相空间，以及具有相同感染率和恢复率或死亡率的四个示例轨迹。同时显示用于训练的完整数据集(蓝色区域)和部分数据集(虚线区域)，分别由63,000和42,000个均匀分布的数据点组成。(b)曲线描述了不同模型的维平均有效信息(J)随训练时间的变化。线表示平均值，而带宽表示五次重复实验的标准差。(c)比较了SIR动力学的矢量场、NIS+的习得宏观动力学和习得编码器的雅可比矩阵变换后的宏观动力学。每个箭头代表一个方向，以及在该坐标点的动力学导数的大小。(d)将整体与局部进行比较，以评估在部分数据集(缺失42,000个数据点)或完整数据集上训练的不同模型的多步预测误差。这些模型包括NIS+、NIS、前馈神经网络(NN)、具有逆概率加权和反向动力学学习技术的前馈神经网络(NN+)、变分自编码器(VAE)及其重加权和反向动力学版本(VAE+)。(e).微观动力学(J (fm))和宏观动力学(J (fm))的CE(∆J)和EI的变化绘制为观测噪声变化的标准差σ。所有这些指标都是跨维度平均的。按照Rosas对CE的定义和计算方法，黄线表示Rosas ' Ψ的变化。垂直线表示归一化MAE的阈值为0.3。当σ大于阈值时，则不符合式1的误差约束，结果不可靠。(f)将SIR动力学的矢量场、NIS的习得宏观动力学和NIS的编码器雅可比矩阵变换后的宏观动力学与(c)进行比较。

+

上图为NIS+学习Boids模型的集体群集行为的实验结果。(a)和(e)给出了各种条件下星体轨迹的实际和预测数据。具体来说，他们给出了在两个分离组和随机偏转角度条件下的多步(50步)预测的比较结果。它们的本征噪声水平α分别为0.001和0.4。(b)展示了多步预测的平均绝对误差(MAE)的上升，因为半径r(表示(a)中物体的初始位置范围)超出了训练数据的限制。(c)用不同的q超参数(代表不同宏观状态的尺度)描述了NIS+的训练时代中维度平均因果出现(∆J)的变化趋势。(d)为显著性图，直观地描述了每个宏观维度与每个体的空间坐标之间的关联。我们用橙色点突出了每个宏观状态维度中最重要的对应微观状态，这些微观状态是使用应用于模型的积分梯度(IG)方法确定的。横轴表示16个物体在微观状态下的x和y坐标，纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体体的坐标，而钢蓝色的实线分隔了实体组。

+

(f)和(g)表示不同噪声水平下∆J和归一化MAE的变化，(f)表示外部噪声(观测，加入微观状态)(δmax)， (g)表示本征噪声(α，通过修改Boids模型的动力学规则加入)。在(f)和(g)中，水平线表示违反式1中误差约束的阈值。当归一化MAE大于阈值0.3时，违反约束，结果不可靠。

= 参考文献 =

念

259

个编辑