更改

跳到导航 跳到搜索
添加691字节 、 2024年8月31日 (星期六)
第392行: 第392行:     
=====NIS+=====
 
=====NIS+=====
但是该方法存在一些不足,作者将优化过程分为两个阶段,但是没有真正的最大化有效信息,即公式{{EquationNote|1}}。因此,[[杨明哲]]等人<ref name=":6" />进一步改进该方法,通过引入反向动力学以及[[重加权技术]]借助[[变分不等式]]将原始的最大化有效信息转换成最大化其变分下界来直接优化目标函数。具体地,根据变分不等式和[[逆概率加权]]方法,公式{{EquationNote|1}}所给出的带约束的优化问题可以转变为如下不带约束的最小化问题:
+
 
 +
NIS虽然率先提出了对EI进行优化,从而在数据中辨识因果涌现的方案,但是该方法存在一些不足:作者将优化过程分为两个阶段,但是并没有真正的最大化有效信息,即公式{{EquationNote|1}}。因此,[[杨明哲]]等人<ref name=":6" />进一步改进该方法,提出了[[NIS+]]方案,通过引入反向动力学以及[[重加权技术]]借助[[变分不等式]]将原始的最大化有效信息转换成最大化其变分下界来直接优化目标函数。
 +
 
 +
======数学原理======
 +
 
 +
具体地,根据变分不等式和[[逆概率加权]]方法,公式{{EquationNote|1}}所给出的带约束的优化问题可以转变为如下不带约束的最小化问题:
    
<math>\min_{\omega,\theta,\theta'} \sum_{i=0}^{T-1}w(\boldsymbol{x}_t)||\boldsymbol{y}_t-g_{\theta'}(\boldsymbol{y}_{t+1})||+\lambda|| \hat{\boldsymbol{x}}_{t+1}-\boldsymbol{x}_{t+1} ||</math>
 
<math>\min_{\omega,\theta,\theta'} \sum_{i=0}^{T-1}w(\boldsymbol{x}_t)||\boldsymbol{y}_t-g_{\theta'}(\boldsymbol{y}_{t+1})||+\lambda|| \hat{\boldsymbol{x}}_{t+1}-\boldsymbol{x}_{t+1} ||</math>
   −
其中<math>g</math>是反向动力学,<math>w(x_t)</math>为逆概率权值,如下所示:
+
其中<math>g</math>是反向动力学,它可以通过神经网络来近似,并通过宏观态的数据对[math]y_{t+1},y_{t}[/math]训练得到。<math>w(x_t)</math>为逆概率权值,具体计算方式如下所示:
    
<math>
 
<math>
第404行: 第409行:  
其中<math>\tilde{p}(\boldsymbol{y}_{t})</math>是目标分布,<math>p(\boldsymbol{y}_{t})</math>是数据的原始分布。
 
其中<math>\tilde{p}(\boldsymbol{y}_{t})</math>是目标分布,<math>p(\boldsymbol{y}_{t})</math>是数据的原始分布。
   −
下图展示了NIS+的整个模型框架,图a是模型的输入:时间序列数据,可以是鸟群轨迹、生命游戏的连续图像以及脑序列数据等;图c是模型的输出,包括因果涌现的程度、宏观动力学、涌现模式以及粗粒化策略;图b是具体的模型架构,区别于NIS方法,增加了反向动力学和重加权技术两部分。
+
======工作流与模型架构======
 +
 
 +
下图展示了NIS+的整个模型框架,图a是模型的输入:时间序列数据,可以是轨迹序列、连续图像序列以及脑电时间序列数据等;图c是模型的输出,包括因果涌现的程度、宏观动力学、涌现模式以及粗粒化策略;图b是具体的模型架构,区别于NIS方法,增加了反向动力学和重加权技术两部分。
    
[[文件:NIS+.png|居左|600x600像素|替代=NIS模型框架图|NIS+模型框架图]]
 
[[文件:NIS+.png|居左|600x600像素|替代=NIS模型框架图|NIS+模型框架图]]
   −
文章对不同的时间序列数据集上进行了实验,包括动力系统模型[[SIR动力学]]、鸟群模型([[Boids模型]])和元胞自动机:[[生命游戏]]所生成的数据,以及人类被试的[[脑神经系统]]fMRI信号真实的数据,这里我们选择鸟群和脑信号分别实验进行分析。
+
======实例分析======
 +
 
 +
文章对不同的时间序列数据集进行了实验,包括疾病传播动力系统模型[[SIR动力学]]、鸟群模型([[Boids模型]])和元胞自动机:[[生命游戏]]所生成的数据,以及真实人类被试的[[脑神经系统]]fMRI信号数据,这里我们选择鸟群和脑信号分别实验进行介绍说明。
   −
下图为NIS+学习Boids模型的群集行为的实验结果。(a)和(e)给出了不同条件下鸟群的实际和预测轨迹。具体来说,作者将鸟群分为两个组,并且比较了在不同噪声水平(<math>\alpha</math>分别为0.001和0.4)下的多步预测结果,在噪音比较小时预测很好,在噪音比较大时预测曲线会发散。(b)展示了多步预测的平均绝对误差(MAE)随着半径r的增加而逐渐上升。(c)展示了不同维度(q)下的[[因果涌现度量]]<math>\Delta J</math>与预测误差(MAE)随着训练epoch的变化,作者发现在q=8时因果涌现最显著。(d)为归因显著性图,直观地描述了每个宏观维度与每只鸟的空间坐标(微观维度)之间的关联,颜色越深关联度越高。这里用橙色点突出了每个宏观状态维度中最大关联值所对应的微观状态,这些值是使用模型的[[积分梯度(IG)]]方法确定的。横轴表示16只鸟在微观状态下的x和y坐标,纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体Boid的坐标,而蓝色实线分隔了两个鸟群。(f)和(g)表示不同噪声水平下<math>\Delta J</math>和归一化MAE的变化,(f)表示外部噪声的变化(即观测噪音加入到微观数据)(g)表示内在噪声(用<math>\alpha</math>表示,通过修改Boids模型的动力学加入)。在(f)和(g)中,水平线表示违反公式{{EquationNote|1}}中误差约束的阈值。当归一化MAE大于阈值0.3时,违反约束,结果不可靠。
+
下图为NIS+学习Boids模型的群集行为的实验结果。(a)和(e)给出了不同条件下鸟群的实际和预测轨迹。具体来说,作者将鸟群分为两个组,并且比较了在不同噪声水平(<math>\alpha</math>分别为0.001和0.4)下的多步预测结果,在噪音比较小时预测很好,在噪音比较大时预测曲线会发散。(b)展示了多步预测的平均绝对误差(MAE)随着半径r的增加而逐渐上升。(c)展示了不同维度(q)下的[[因果涌现度量]]<math>\Delta J</math>与预测误差(MAE)随着训练epoch的变化,作者发现在宏观态维度q=8时因果涌现最显著。(d)为宏观变量对微观变量进行归因分析,得到的显著性图,直观地描述了学习得到的粗粒化函数。其中,每个宏观维度可以对应到每只鸟的空间坐标(微观维度),颜色越深表示关联度越高。这里用橙色点突出了每个宏观状态维度最大关联所对应的微观坐标,这些归因显著性值是使用的[[积分梯度]](Integrated Gradient,简称IG)方法得到的。横轴表示16只鸟在微观状态下的x和y坐标,纵轴表示8个宏观维度。淡蓝色的虚线区分了不同个体Boid的坐标,而蓝色实线分隔了两个鸟群。(f)和(g)表示不同噪声水平下因果涌现度量<math>\Delta J</math>和归一化误差MAE的变化趋势,(f)表示外部噪声的变化(即观测噪音加入到微观数据)对因果涌现的影响, (g)表示内在噪声(用<math>\alpha</math>表示,通过修改Boids模型的动力学加入)对因果涌现的影响。在(f)和(g)中,水平线表示违反公式{{EquationNote|1}}中误差约束的阈值。当归一化MAE大于阈值0.3时,约束遭到破坏,结果不可靠。
   −
这组实验表明,[[NIS+]]可以通过最大化EI来学习宏观状态和粗粒化策略。这种最大化增强了模型对超出训练数据范围情况的泛化能力。学习到的宏观状态有效地识别了平均[[群体行为]],并且可以使用梯度积分方法将其归因于个体位置。此外,因果涌现的程度随外在噪声的增加而增加,而随内在噪声的减少而减少。这一观察结果表明,通过粗粒化可以消除外在噪声,而不能削减内在噪声。
+
这组实验表明,[[NIS+]]可以通过最大化EI来学习宏观状态和粗粒化策略。这种最大化增强了模型对超出训练数据范围情况的泛化能力。学习到的宏观状态有效地识别了平均[[群体行为]],并且可以使用梯度积分方法将其归因于个体位置。此外,因果涌现的程度随外在噪声的增加而增加,而随内在噪声的增加而减少。这一观察结果表明,模型通过粗粒化可以消除外在噪声,而不能削减内在噪声。
    
[[文件:NIS+ boids.png|居左|600x600像素|鸟群中的因果涌现]]
 
[[文件:NIS+ boids.png|居左|600x600像素|鸟群中的因果涌现]]
   −
脑实验是基于FMRI数据,对830个人类被试做了两组实验,第一组是让他们执行看一段电影短片的视觉任务,第二组实验是让他们处于静息态下。由于原始维度比较高,作者们首先通过使用[[Schaefer atlas]]方法对原始的14000维数据降维到100个维度,每个维度对应一个脑区。之后,作者们通过NIS+学习这些数据,并提炼出6个不同宏观尺度下的动力学,图a展示了不同尺度下的多步预测误差结果,图b展示了在静息态和看电影视觉任务中NIS与NIS+方法在不同宏观维度上EI的对比。作者们发现在视觉任务数据中,维度q=1时因果涌现最显著,通过归因分析发现视觉区发挥的作用最大(图c),与真实的场景保持一致,图d展示了脑区归因的不同视角图。而在静息态下,1个宏观维度不足以预测微观时间序列数据,因果涌现最大的维度是表现在3-7维之间。
+
脑实验是基于真实的FMRI数据,该数据通过对830个人类被试做了两组实验得到。第一组是让被试执行看一段电影短片的视觉任务记录完成,第二组实验是让他们处于静息态下记录完成。由于原始维度比较高,作者们首先通过使用[[Schaefer atlas]]方法对原始的14000维数据降维到100个维度,每个维度对应一个脑区。之后,作者们通过NIS+学习这些数据,并提炼出6个不同宏观尺度下的动力学,图a展示了不同尺度下的多步预测误差结果,图b展示了在静息态和看电影视觉任务中NIS与NIS+方法在不同宏观维度上EI的对比。作者们发现在视觉任务中,宏观态维度在q=1时因果涌现最显著,通过归因分析发现视觉区发挥的作用最大(图c),与真实的场景保持一致。图d展示了脑区归因的不同视角图。而在静息态下,1个宏观维度不足以预测微观时间序列数据,因果涌现最大的维度是表现在3-7维之间。
    
[[文件:NIS+ 脑数据.png|居左|600x600像素|脑神经系统中的因果涌现]]
 
[[文件:NIS+ 脑数据.png|居左|600x600像素|脑神经系统中的因果涌现]]
   −
这些实验表明NIS+不仅可以辨识数据中的因果涌现、发现涌现的宏观动力学和粗粒化策略,而且还能够通过EI最大化而增加模型的分布外泛化能力。
+
这些实验表明NIS+不仅可以辨识数据中的因果涌现、发现涌现的宏观动力学和粗粒化策略,而且另外的实验还表明,[[NIS+]]模型还能够通过EI最大化而增加模型的分布外泛化能力。
    
==应用==
 
==应用==
786

个编辑

导航菜单