更改

跳到导航 跳到搜索
无编辑摘要
第6行: 第6行:     
=简介=
 
=简介=
基于可逆性的因果涌现理论是一种量化[[因果涌现 Causal Emergence|因果涌现]]的新框架,该方法基于奇异值分解和动力学可逆性的概念,核心概念是近似动力学可逆性。借助近似动力学可逆性可以定义清晰因果涌现和模糊因果涌现的概念,并形成完整的量化因果涌现方法。
   
Erik Hoel的因果涌现理论存在着需要指定粗粒化策略的问题,Rosas的信息分解理论并没有完全解决,因此,[[张江]]等人进一步提出了<ref name=":2">Zhang J, Tao R, Yuan B. Dynamical Reversibility and A New Theory of Causal Emergence. arXiv preprint arXiv:2402.15054. 2024 Feb 23.</ref>基于奇异值分解和动力学近似可逆性的因果涌现理论。
 
Erik Hoel的因果涌现理论存在着需要指定粗粒化策略的问题,Rosas的信息分解理论并没有完全解决,因此,[[张江]]等人进一步提出了<ref name=":2">Zhang J, Tao R, Yuan B. Dynamical Reversibility and A New Theory of Causal Emergence. arXiv preprint arXiv:2402.15054. 2024 Feb 23.</ref>基于奇异值分解和动力学近似可逆性的因果涌现理论。
   第33行: 第32行:     
总结来看,该定量化因果涌现的方法的好处在于,它可以不依赖于具体的粗粒化策略,因而可以更加客观地量化因果涌现。该方法的缺点是,若要计算[math]\Gamma_{\alpha}[/math],需要事先对P进行[[SVD分解]],因而计算复杂度为[math]O(N^3)[/math],因而比<math>EI</math>的计算复杂度高。而且,[math]\Gamma_{\alpha}[/math]不能显式地分解为确定度和简并度两个分量。
 
总结来看,该定量化因果涌现的方法的好处在于,它可以不依赖于具体的粗粒化策略,因而可以更加客观地量化因果涌现。该方法的缺点是,若要计算[math]\Gamma_{\alpha}[/math],需要事先对P进行[[SVD分解]],因而计算复杂度为[math]O(N^3)[/math],因而比<math>EI</math>的计算复杂度高。而且,[math]\Gamma_{\alpha}[/math]不能显式地分解为确定度和简并度两个分量。
 +
[[文件:图x.png|居中|有框|图1]]
   −
[[文件:Gamma例子.png|居左|400x400像素|<math>EI</math>与<math>\Gamma</math>对比]]
     −
文中作者通过实例对比了状态转移矩阵的<math>EI</math>和<math>\Gamma_{1}</math>。对比图a,b,我们发现对于不同的状态转移矩阵,<math>EI</math>降低的时候,<math>\Gamma_1</math>也同步降低。进一步,图c和d是对比粗粒化前后的效果,其中图d是对图c状态转移矩阵的粗粒化(将前三个状态归并为一个宏观态)。由于宏观状态转移矩阵图d是一个[[确定性系统]],因此,归一化后的<math>EI</math>,<math>eff\equiv EI/\log N</math>和归一化后的[math]\Gamma_1[/math]:<math>\gamma_1\equiv \Gamma_1/N</math>都达到了最大值1。
+
文中作者通过实例对比了状态转移矩阵的<math>EI</math>和<math>\Gamma_{1}</math>。对比图1a,b,我们发现对于不同的状态转移矩阵,<math>EI</math>降低的时候,<math>\Gamma_1</math>也同步降低。进一步,图c和d是对比粗粒化前后的效果,其中图d是对图c状态转移矩阵的粗粒化(将前三个状态归并为一个宏观态)。由于宏观状态转移矩阵图d是一个[[确定性系统]],因此,归一化后的<math>EI</math>,<math>eff\equiv EI/\log N</math>和归一化后的[math]\Gamma_1[/math]:<math>\gamma_1\equiv \Gamma_1/N</math>都达到了最大值1。
    
=基本概念=
 
=基本概念=
下面介绍该理论的几个基本概念,分别是动力学可逆性、近似动力学可逆性、清晰因果涌现和模糊因果涌现。
+
下面详细介绍该理论的基本概念,分别是动力学可逆性、近似动力学可逆性、清晰因果涌现和模糊因果涌现。
 
==动力学可逆性==
 
==动力学可逆性==
 
对于给定的马尔可夫链<math>
 
对于给定的马尔可夫链<math>
第280行: 第279行:  
</math>。下面通过数值模拟说明这一点。
 
</math>。下面通过数值模拟说明这一点。
   −
如图1 所示,在由三种不同方法生成的各种归一化的TPM 上比较了<math>
+
如图2 所示,在由三种不同方法生成的各种归一化的TPM 上比较了<math>
 
\log{\Gamma_{\alpha}}
 
\log{\Gamma_{\alpha}}
</math>和 EI:1)软化置换矩阵;2)软化退化矩阵;3)完全随机矩阵。图1(a)、(b)和(c)表明,在这些例子中都观察到了正相关性,并且在N ≫ 1 时,<math>
+
</math>和 EI:1)软化置换矩阵;2)软化退化矩阵;3)完全随机矩阵。图2(a)、(b)和(c)表明,在这些例子中都观察到了正相关性,并且在N ≫ 1 时,<math>
 
EI\sim\log{\Gamma_{\alpha}}.
 
EI\sim\log{\Gamma_{\alpha}}.
</math>的近似关系得到了证实。在图1(a) 和 (b) 中可以明显观察到这种关系,但在图1(b) 中,由于覆盖了有限的<math>
+
</math>的近似关系得到了证实。在图2(a) 和 (b) 中可以明显观察到这种关系,但在图2(b) 中,由于覆盖了有限的<math>
 
\Gamma
 
\Gamma
 
</math>值区域,这种关系退化为近似线性关系。
 
</math>值区域,这种关系退化为近似线性关系。
   −
图1(a)和(b)中用红色虚线表示了 EI 的上下限。不过,在图1(c)中,由于所有点都集中在一个小区域内,因此看不到理论边界线。根据经验,图1 中灰色断线所示的对数<math>\log{\Gamma_{\alpha}}
+
图2(a)和(b)中用红色虚线表示了 EI 的上下限。不过,在图2(c)中,由于所有点都集中在一个小区域内,因此看不到理论边界线。根据经验,图2 中灰色断线所示的对数<math>\log{\Gamma_{\alpha}}
 
</math>的EI上限更为严格。因此可以推测 <math>EI\le\log{\Gamma_{\alpha}}
 
</math>的EI上限更为严格。因此可以推测 <math>EI\le\log{\Gamma_{\alpha}}
 
</math>这一新关系是成立的,但其严密性有待今后的工作来证明。
 
</math>这一新关系是成立的,但其严密性有待今后的工作来证明。
第296行: 第295行:  
</math>的解析解,并展示了EI和<math>
 
</math>的解析解,并展示了EI和<math>
 
\Gamma
 
\Gamma
</math>与参数p和q的关系。图1(c)和(d)之间的差异显而易见:1)当<math>
+
</math>与参数p和q的关系。图2(c)和(d)之间的差异显而易见:1)当<math>
 
p\approx 1-q
 
p\approx 1-q
 
</math>时,<math>\Gamma
 
</math>时,<math>\Gamma
第304行: 第303行:  
因此,我们得出结论,EI和<math>\Gamma
 
因此,我们得出结论,EI和<math>\Gamma
 
</math>在各种TPM上高度相关。
 
</math>在各种TPM上高度相关。
[[文件:截屏2024-08-11 18.32.26.png|居中|缩略图|773x773px|图1|替代=]]
+
[[文件:截屏2024-08-11 18.32.26.png|居中|缩略图|773x773px|图2|替代=]]
    
==不同==
 
==不同==
第317行: 第316行:  
可以通过以下数值实验来验证这一点:可以通过将线性相关行向量与线性独立行向量混合来创建TPM,其中独立向量的数量或等级是受控参数。首先,生成r个独立的独热向量,然后软化这些行向量,软化程度由<math>
 
可以通过以下数值实验来验证这一点:可以通过将线性相关行向量与线性独立行向量混合来创建TPM,其中独立向量的数量或等级是受控参数。首先,生成r个独立的独热向量,然后软化这些行向量,软化程度由<math>
 
\sigma</math>确定。随后,通过将这些软化的独热向量与随机选择的线性系数线性组合来创建额外的行向量。然后量化<math>
 
\sigma</math>确定。随后,通过将这些软化的独热向量与随机选择的线性系数线性组合来创建额外的行向量。然后量化<math>
\Gamma</math>和 EI 之间的差异,结果如图1(d) 所示。
+
\Gamma</math>和 EI 之间的差异,结果如图2(d) 所示。
    
很明显,对于较小的r值,随着<math>
 
很明显,对于较小的r值,随着<math>
第339行: 第338行:  
==布尔网络==
 
==布尔网络==
 
下面基于Hoel等人的论文<ref name="Hoel2013">Hoel, E.P., Albantakis, L., Tononi, G.: Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences of the United States of America 110(49), 19790–19795 (2013) https://doi.org/10.1073/ pnas.1314922110</ref><ref name="Hoel2017">Hoel, E.P.: When the map is better than the territory. Entropy 19(5) (2017) https://doi.org/10.3390/e19050188</ref>中提出的几种布尔网络马尔可夫动力学来测试清晰和模糊因果涌现的定义。
 
下面基于Hoel等人的论文<ref name="Hoel2013">Hoel, E.P., Albantakis, L., Tononi, G.: Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences of the United States of America 110(49), 19790–19795 (2013) https://doi.org/10.1073/ pnas.1314922110</ref><ref name="Hoel2017">Hoel, E.P.: When the map is better than the territory. Entropy 19(5) (2017) https://doi.org/10.3390/e19050188</ref>中提出的几种布尔网络马尔可夫动力学来测试清晰和模糊因果涌现的定义。
[[文件:截屏2024-08-14 11.10.36.png.png|居中|缩略图|755x755px|图2|替代=]]
+
[[文件:截屏2024-08-14 11.10.36.png.png|居中|缩略图|755x755px|图3|替代=]]
   −
图2(a-i)分别显示了从具有相同节点机制的相同布尔网络模型生成的用于因果涌现和模糊因果涌现的TPM的两个示例。图2(d)中的TPM直接源自图2(a)和(b)中的布尔网络及其节点机制。它们的奇异值谱分别如图2(e)和(h)所示。(d)中的第一个例子只有4个非零奇异值(图2(e)),因此,出现明显的因果涌现,且因果涌现的程度为<math>
+
图3(a-i)分别显示了从具有相同节点机制的相同布尔网络模型生成的用于因果涌现和模糊因果涌现的TPM的两个示例。图3(d)中的TPM直接源自图3(a)和(b)中的布尔网络及其节点机制。它们的奇异值谱分别如图3(e)和(h)所示。(d)中的第一个例子只有4个非零奇异值(图3(e)),因此,出现明显的因果涌现,且因果涌现的程度为<math>
 
\Delta\Gamma=0.75
 
\Delta\Gamma=0.75
 
</math>。 因果涌现的判断与参考文献<ref name="Hoel2013" />相同。
 
</math>。 因果涌现的判断与参考文献<ref name="Hoel2013" />相同。
   −
图2(g)中的TPM可以显示出模糊的因果涌现,这是在(d)中的TPM上添加强度为(std = 0.03)的随机高斯噪声后得到的。因此,奇异频谱如图2(h) 所示。我们选择<math>
+
图3(g)中的TPM可以显示出模糊的因果涌现,这是在(d)中的TPM上添加强度为(std = 0.03)的随机高斯噪声后得到的。因此,奇异频谱如图3(h) 所示。我们选择<math>
 
\epsilon=0.2
 
\epsilon=0.2
 
</math>作为阈值,这样就只剩下4个大的奇异值。因果涌现程度为<math>
 
</math>作为阈值,这样就只剩下4个大的奇异值。因果涌现程度为<math>
第351行: 第350行:  
</math>。<math>
 
</math>。<math>
 
\epsilon
 
\epsilon
</math>值是根据图2(h)中的奇异值频谱选择的,在图2(h)中可以观察到指数为3和<math>
+
</math>值是根据图3(h)中的奇异值频谱选择的,在图3(h)中可以观察到指数为3和<math>
 
\epsilon=0.2
 
\epsilon=0.2
</math>时有一个明显的分界点。图3(a-f)显示了另一个更复杂的布尔网络模型的明显因果涌现例子,该模型来自参考文献<ref name="Hoel2013" />,其中具有相同节点机制的6个节点可归类为3个超级节点,以显示因果涌现。原始布尔网络模型的相应TPM如图3(c)所示。奇异值频谱如图3(d)所示,其中有8个非零值。这个清晰因果涌现的度数为<math>
+
</math>时有一个明显的分界点。图4(a-f)显示了另一个更复杂的布尔网络模型的明显因果涌现例子,该模型来自参考文献<ref name="Hoel2013" />,其中具有相同节点机制的6个节点可归类为3个超级节点,以显示因果涌现。原始布尔网络模型的相应TPM如图4(c)所示。奇异值频谱如图4(d)所示,其中有8个非零值。这个清晰因果涌现的度数为<math>
 
\Delta\Gamma=2.23
 
\Delta\Gamma=2.23
 
</math>。对因果涌现的判断与<ref name="Hoel2013" />相同。
 
</math>。对因果涌现的判断与<ref name="Hoel2013" />相同。
[[文件:截屏2024-08-14 11.13.54.png|居中|缩略图|776x776px|图3|替代=]]
+
[[文件:截屏2024-08-14 11.13.54.png|居中|缩略图|776x776px|图4|替代=]]
 
==复杂网络==
 
==复杂网络==
   −
对因果涌现的量化可应用于复杂网络(图2(j-l))。图2(j-l)显示了由随机块模型(SBM)生成的具有三组参数(内部或内部连接概率)的复杂网络的模糊因果涌现例子。TPM是通过对网络的邻接矩阵按每个节点的度进行归一化得到的。图2(j)显示了一个有 100 个节点和 5 个区块(社区)的示例网络,图2(k)显示了其奇异值频谱,在与区块数相同的横坐标上可以观察到一个明显的分界点<math>
+
对因果涌现的量化可应用于复杂网络(图3(j-l))。图3(j-l)显示了由随机块模型(SBM)生成的具有三组参数(内部或内部连接概率)的复杂网络的模糊因果涌现例子。TPM是通过对网络的邻接矩阵按每个节点的度进行归一化得到的。图3(j)显示了一个有 100 个节点和 5 个区块(社区)的示例网络,图3(k)显示了其奇异值频谱,在与区块数相同的横坐标上可以观察到一个明显的分界点<math>
 
(\epsilon=0.3,r_{\epsilon}=5)
 
(\epsilon=0.3,r_{\epsilon}=5)
 
</math>。可以确定,在这个网络模型中出现了模糊的因果涌现,程度为<math>
 
</math>。可以确定,在这个网络模型中出现了模糊的因果涌现,程度为<math>
第365行: 第364行:  
</math>。同图中还显示了两个由SBM生成的网络光谱,它们的大小和块数相同,但参数不同。
 
</math>。同图中还显示了两个由SBM生成的网络光谱,它们的大小和块数相同,但参数不同。
 
==元胞自动机==
 
==元胞自动机==
如图3(g-i)所示,关于清晰因果涌现的定义可应用于元胞自动机,以发现其局部涌现结构。在这个例子里刻画了元胞自动机(编号40的基本一维元胞自动机)局部TPM的清晰因果涌现。局部TPM 由包括每个单元及其两个相邻单元的局部窗口获得。图3(h) 显示了这些局部 TPM 的奇异值的可能频谱,在这些频谱中可能出现也可能不出现清晰因果涌现。图3(i)用红点标记显示了所有单元和时间步长的清晰因果涌现分布(<math>
+
如图4(g-i)所示,关于清晰因果涌现的定义可应用于元胞自动机,以发现其局部涌现结构。在这个例子里刻画了元胞自动机(编号40的基本一维元胞自动机)局部TPM的清晰因果涌现。局部TPM 由包括每个单元及其两个相邻单元的局部窗口获得。图4(h) 显示了这些局部 TPM 的奇异值的可能频谱,在这些频谱中可能出现也可能不出现清晰因果涌现。图4(i)用红点标记显示了所有单元和时间步长的清晰因果涌现分布(<math>
 
\Delta\Gamma
 
\Delta\Gamma
 
</math>)。
 
</math>)。
第404行: 第403行:  
\Phi</math>和P得到新的TPM,使总静态通量保持不变。
 
\Phi</math>和P得到新的TPM,使总静态通量保持不变。
 
==测试效果==
 
==测试效果==
在图2 和图3 所示的所有示例中测试了此粗粒化方法。首先,对于根据图2(d) 和 (g) 所示的相同布尔网络模型生成的两个 TPM,其粗 TPM 分别如图2(f)和(i)所示。从TPM和投影矩阵<math>
+
在图3 和图4 所示的所有示例中测试了此粗粒化方法。首先,对于根据图3(d) 和 (g) 所示的相同布尔网络模型生成的两个 TPM,其粗 TPM 分别如图3(f)和(i)所示。从TPM和投影矩阵<math>
\Phi</math>中可以读出宏观布尔网络模型(图2(c))。值得注意的是,粗TPM中的<math>
+
\Phi</math>中可以读出宏观布尔网络模型(图3(c))。值得注意的是,粗TPM中的<math>
 
\Gamma
 
\Gamma
 
</math>与原始模型中的<math>
 
</math>与原始模型中的<math>
第411行: 第410行:  
</math>几乎完全相同,这说明我们的方法在这种情况下是<math>
 
</math>几乎完全相同,这说明我们的方法在这种情况下是<math>
 
\Gamma
 
\Gamma
</math>保守的。其次,如图3(e) 所示,用相同的粗粒度方法可以得到原始TPM(图3(a))的缩小TPM,投影矩阵<math>
+
</math>保守的。其次,如图4(e) 所示,用相同的粗粒度方法可以得到原始TPM(图4(a))的缩小TPM,投影矩阵<math>
\Phi</math>如 (f) 所示。如图3(b)所示,粗粒度布尔网络可以从简化的TPM和投影矩阵中读出。在本例中,虽然由于粗粒化过程中的信息损失,<math>
+
\Phi</math>如 (f) 所示。如图4(b)所示,粗粒度布尔网络可以从简化的TPM和投影矩阵中读出。在本例中,虽然由于粗粒化过程中的信息损失,<math>
 
\Gamma
 
\Gamma
 
</math>被大大缩小了(从 <math>
 
</math>被大大缩小了(从 <math>
第422行: 第421行:  
=0.32</math>增加到<math>
 
=0.32</math>增加到<math>
 
\gamma
 
\gamma
=1.0</math>)。同样的粗粒化方法也适用于SBM生成的复杂网络。图2(l)显示了从原始网络(图2(j))衍生出的 5 节点精简网络。图2(l)显示了从原始网络(图2(j))得到的具有 5 个节点的缩小网络(图2(l))。并观察到具有相关性的<math>
+
=1.0</math>)。同样的粗粒化方法也适用于SBM生成的复杂网络。图3(l)显示了从原始网络(图3(j))衍生出的 5 节点精简网络。图3(l)显示了从原始网络(图3(j))得到的具有 5 个节点的缩小网络(图3(l))。并观察到具有相关性的<math>
 
\Gamma
 
\Gamma
 
</math>大幅下降和<math>
 
</math>大幅下降和<math>
140

个编辑

导航菜单