更改

跳到导航 跳到搜索
删除12字节 、 2024年8月26日 (星期一)
第572行: 第572行:  
根据观察,CE在q = 8时达到最大值,如图(c)所示,这与本实验选择超参数q = 8(宏观变量的维度)相符。
 
根据观察,CE在q = 8时达到最大值,如图(c)所示,这与本实验选择超参数q = 8(宏观变量的维度)相符。
   −
二、提高NIS+训练粗粒化策略的可解释性。
+
二、NIS+粗粒化策略的可解释性。
    
作者利用积分梯度(IG)<ref name=":6">Sundararajan M, Taly A and Yan Q. Axiomatic attribution for deep networks. Proceedings of the 34th International Conference on Machine Learning, Sydney, 6-11 August
 
作者利用积分梯度(IG)<ref name=":6">Sundararajan M, Taly A and Yan Q. Axiomatic attribution for deep networks. Proceedings of the 34th International Conference on Machine Learning, Sydney, 6-11 August
第578行: 第578行:  
2017.</ref>来识别每个学到的涌现宏观状态维度中最重要的微观状态,将计算的IG归一化,并在每个宏观状态中提高微观状态的最大梯度,并且忽略每只鸟的速度维度(与宏观状态的相关性较低)。最后,作者将归一化的IG绘制成矩阵图。
 
2017.</ref>来识别每个学到的涌现宏观状态维度中最重要的微观状态,将计算的IG归一化,并在每个宏观状态中提高微观状态的最大梯度,并且忽略每只鸟的速度维度(与宏观状态的相关性较低)。最后,作者将归一化的IG绘制成矩阵图。
   −
实验结果表明(图(d)),宏观状态的第1、2、5、6维分别对应第一组中的ID(ID<8),第3、4、7、8维对应第二组中的ID(ID>=8)。因此,学习到的粗粒度策略使用两个位置坐标来表示所有其他信息,形成一个维度的宏观状态。
+
实验结果表明(图(d)),宏观状态的第1、2、5、6维分别对应第一组中的ID(ID<8),第3、4、7、8维对应第二组中的ID(ID>=8)。因此,学习到的粗粒化策略使用两个位置坐标来表示所有其他信息,形成一个维度的宏观状态。
    
三、NIS+的泛化能力。
 
三、NIS+的泛化能力。
251

个编辑

导航菜单