第4行: |
第4行: |
| \Gamma_{\alpha} | | \Gamma_{\alpha} |
| </math>可用于量化因果涌现的强度。经过理论推导和数值实验证明,在对因果涌现的判断和量化上,该理论与Eric Hoel等人提出的基于[[有效信息]](EI)的因果涌现理论具有相同的效果,且<math> | | </math>可用于量化因果涌现的强度。经过理论推导和数值实验证明,在对因果涌现的判断和量化上,该理论与Eric Hoel等人提出的基于[[有效信息]](EI)的因果涌现理论具有相同的效果,且<math> |
− | log\Gamma_{\alpha}
| + | \Gamma_{\alpha} |
| </math>和EI在多个方面存在联系。此外,该理论还提出了基于奇异值分解的新粗粒化方法,并通过实验证明了该方法的有效性。 | | </math>和EI在多个方面存在联系。此外,该理论还提出了基于奇异值分解的新粗粒化方法,并通过实验证明了该方法的有效性。 |
| | | |
− | ==简介==
| + | =简介= |
| 基于可逆性的因果涌现理论的核心概念是近似动力学可逆性: | | 基于可逆性的因果涌现理论的核心概念是近似动力学可逆性: |
| | | |
第23行: |
第23行: |
| \Gamma_{\alpha} | | \Gamma_{\alpha} |
| </math>可以定义清晰因果涌现和模糊因果涌现的概念,形成完整的量化因果涌现方法。 | | </math>可以定义清晰因果涌现和模糊因果涌现的概念,形成完整的量化因果涌现方法。 |
− | ==基本概念==
| + | =基本概念= |
| 下面介绍该理论的几个基本概念,分别是动力学可逆性、近似动力学可逆性、清晰因果涌现和模糊因果涌现。 | | 下面介绍该理论的几个基本概念,分别是动力学可逆性、近似动力学可逆性、清晰因果涌现和模糊因果涌现。 |
− | ===动力学可逆性===
| + | ==动力学可逆性== |
− | | |
| 对于给定的马尔可夫链<math> | | 对于给定的马尔可夫链<math> |
| \chi | | \chi |
第81行: |
第80行: |
| 这也是所有奇异值的平方和。可以看出矩阵的秩和弗罗贝尼乌斯范数都与奇异值相联系。 | | 这也是所有奇异值的平方和。可以看出矩阵的秩和弗罗贝尼乌斯范数都与奇异值相联系。 |
| | | |
− | ===近似动力学可逆性===
| + | ==近似动力学可逆性== |
| 下面定义矩阵P的近似动力学可逆性: | | 下面定义矩阵P的近似动力学可逆性: |
| | | |
第124行: |
第123行: |
| </math>确定<ref name="Zhangjiang" />。 | | </math>确定<ref name="Zhangjiang" />。 |
| | | |
− | ====决定性和简并性====
| + | ===决定性和简并性=== |
| 通过调整参数<math> | | 通过调整参数<math> |
| \alpha\in(0,2) | | \alpha\in(0,2) |
第159行: |
第158行: |
| </math>。 | | </math>。 |
| | | |
− | ====归一化====
| + | ===归一化=== |
| <math> | | <math> |
| \Gamma_{\alpha=1} | | \Gamma_{\alpha=1} |
第211行: |
第210行: |
| EI\sim\log\Gamma_{\alpha}. | | EI\sim\log\Gamma_{\alpha}. |
| </math> | | </math> |
− | ===清晰因果涌现===
| + | ==清晰因果涌现== |
| 对于具有TPM P的给定马尔可夫链<math> | | 对于具有TPM P的给定马尔可夫链<math> |
| \chi | | \chi |
第219行: |
第218行: |
| \Delta\Gamma_{\alpha}=\Gamma_{\alpha}\cdot(\frac{1}{r}-\frac{1}{N}) | | \Delta\Gamma_{\alpha}=\Gamma_{\alpha}\cdot(\frac{1}{r}-\frac{1}{N}) |
| </math> | | </math> |
− | ===模糊因果涌现===
| + | ==模糊因果涌现== |
| 对于具有TPM P的给定马尔可夫链<math> | | 对于具有TPM P的给定马尔可夫链<math> |
| \chi | | \chi |
第264行: |
第263行: |
| </math>只有当<math>\Delta\Gamma_{\alpha}(\epsilon)>0 | | </math>只有当<math>\Delta\Gamma_{\alpha}(\epsilon)>0 |
| </math>时,才会出现因果涌现。命题和证明见参考文献<ref name="Zhangjiang" />附录A.3.1。 | | </math>时,才会出现因果涌现。命题和证明见参考文献<ref name="Zhangjiang" />附录A.3.1。 |
− | ==与有效信息(EI)的比较==
| + | =与有效信息(EI)的比较= |
| | | |
− | ===相似性===
| + | ==相似性== |
| 根据定理4,EI的上界和下界分别是<math>\log{\Gamma_{\alpha}} | | 根据定理4,EI的上界和下界分别是<math>\log{\Gamma_{\alpha}} |
| </math>的线性项。由此还可以推测两者具有近似关系:<math> | | </math>的线性项。由此还可以推测两者具有近似关系:<math> |
第298行: |
第297行: |
| [[文件:截屏2024-08-11 18.32.26.png|居中|缩略图|773x773px|图1|替代=]] | | [[文件:截屏2024-08-11 18.32.26.png|居中|缩略图|773x773px|图1|替代=]] |
| | | |
− | ===不同===
| + | ==不同== |
| 首先,EI 通过KL散度来量化每个行向量与P的平均行向量之间的差异。换句话说,EI衡量的是行向量之间的相似性。相反,<math> | | 首先,EI 通过KL散度来量化每个行向量与P的平均行向量之间的差异。换句话说,EI衡量的是行向量之间的相似性。相反,<math> |
| \Gamma_{\alpha} | | \Gamma_{\alpha} |
第328行: |
第327行: |
| \Gamma_{\alpha} | | \Gamma_{\alpha} |
| </math>可以提供有关行向量的更全面的见解,超越其与平均行向量的相似性。 | | </math>可以提供有关行向量的更全面的见解,超越其与平均行向量的相似性。 |
− | ==测试量化因果涌现的效果==
| + | =测试量化因果涌现的效果= |
− | ===布尔网络===
| + | ==布尔网络== |
| 下面基于Hoel等人的论文<ref name="Hoel2013">Hoel, E.P., Albantakis, L., Tononi, G.: Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences of the United States of America 110(49), 19790–19795 (2013) https://doi.org/10.1073/ pnas.1314922110</ref><ref name="Hoel2017">Hoel, E.P.: When the map is better than the territory. Entropy 19(5) (2017) https://doi.org/10.3390/e19050188</ref>中提出的几种布尔网络马尔可夫动力学来测试清晰和模糊因果涌现的定义。 | | 下面基于Hoel等人的论文<ref name="Hoel2013">Hoel, E.P., Albantakis, L., Tononi, G.: Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences of the United States of America 110(49), 19790–19795 (2013) https://doi.org/10.1073/ pnas.1314922110</ref><ref name="Hoel2017">Hoel, E.P.: When the map is better than the territory. Entropy 19(5) (2017) https://doi.org/10.3390/e19050188</ref>中提出的几种布尔网络马尔可夫动力学来测试清晰和模糊因果涌现的定义。 |
| [[文件:截屏2024-08-14 11.10.36.png.png|居中|缩略图|755x755px|图2|替代=]] | | [[文件:截屏2024-08-14 11.10.36.png.png|居中|缩略图|755x755px|图2|替代=]] |
第349行: |
第348行: |
| </math>。对因果涌现的判断与<ref name="Hoel2013" />相同。 | | </math>。对因果涌现的判断与<ref name="Hoel2013" />相同。 |
| [[文件:截屏2024-08-14 11.13.54.png|居中|缩略图|776x776px|图3|替代=]] | | [[文件:截屏2024-08-14 11.13.54.png|居中|缩略图|776x776px|图3|替代=]] |
− | ===复杂网络===
| + | ==复杂网络== |
| | | |
| 对因果涌现的量化可应用于复杂网络(图2(j-l))。图2(j-l)显示了由随机块模型(SBM)生成的具有三组参数(内部或内部连接概率)的复杂网络的模糊因果涌现例子。TPM是通过对网络的邻接矩阵按每个节点的度进行归一化得到的。图2(j)显示了一个有 100 个节点和 5 个区块(社区)的示例网络,图2(k)显示了其奇异值频谱,在与区块数相同的横坐标上可以观察到一个明显的分界点<math> | | 对因果涌现的量化可应用于复杂网络(图2(j-l))。图2(j-l)显示了由随机块模型(SBM)生成的具有三组参数(内部或内部连接概率)的复杂网络的模糊因果涌现例子。TPM是通过对网络的邻接矩阵按每个节点的度进行归一化得到的。图2(j)显示了一个有 100 个节点和 5 个区块(社区)的示例网络,图2(k)显示了其奇异值频谱,在与区块数相同的横坐标上可以观察到一个明显的分界点<math> |
第356行: |
第355行: |
| \Delta\Gamma(0.3)=0.56 | | \Delta\Gamma(0.3)=0.56 |
| </math>。同图中还显示了两个由SBM生成的网络光谱,它们的大小和块数相同,但参数不同。 | | </math>。同图中还显示了两个由SBM生成的网络光谱,它们的大小和块数相同,但参数不同。 |
− | ===元胞自动机===
| + | ==元胞自动机== |
| 如图3(g-i)所示,关于清晰因果涌现的定义可应用于元胞自动机,以发现其局部涌现结构。在这个例子里刻画了元胞自动机(编号40的基本一维元胞自动机)局部TPM的清晰因果涌现。局部TPM 由包括每个单元及其两个相邻单元的局部窗口获得。图3(h) 显示了这些局部 TPM 的奇异值的可能频谱,在这些频谱中可能出现也可能不出现清晰因果涌现。图3(i)用红点标记显示了所有单元和时间步长的清晰因果涌现分布(<math> | | 如图3(g-i)所示,关于清晰因果涌现的定义可应用于元胞自动机,以发现其局部涌现结构。在这个例子里刻画了元胞自动机(编号40的基本一维元胞自动机)局部TPM的清晰因果涌现。局部TPM 由包括每个单元及其两个相邻单元的局部窗口获得。图3(h) 显示了这些局部 TPM 的奇异值的可能频谱,在这些频谱中可能出现也可能不出现清晰因果涌现。图3(i)用红点标记显示了所有单元和时间步长的清晰因果涌现分布(<math> |
| \Delta\Gamma | | \Delta\Gamma |
| </math>)。 | | </math>)。 |
− | ==基于SVD分解的新粗粒化策略==
| + | =基于SVD分解的新粗粒化策略= |
| 虽然无需粗粒化也能定义和量化清晰或模糊因果涌现,但需要对原始系统进行更简单的粗粒化描述,以便与 EI 得出的结果进行比较。因此,该理论提供了一种基于奇异值分解的粗粒度方法,以获得宏观层面的简化TPM。其基本思想是将 P 中的行向量 <math> | | 虽然无需粗粒化也能定义和量化清晰或模糊因果涌现,但需要对原始系统进行更简单的粗粒化描述,以便与 EI 得出的结果进行比较。因此,该理论提供了一种基于奇异值分解的粗粒度方法,以获得宏观层面的简化TPM。其基本思想是将 P 中的行向量 <math> |
| P_{i},\forall i \in [1,N] | | P_{i},\forall i \in [1,N] |
第368行: |
第367行: |
| \Gamma | | \Gamma |
| </math>不变。 | | </math>不变。 |
− | ===方法===
| + | ==方法== |
| 该粗粒化方法包括五个步骤:1) 对TPM进行SVD分解;2)选择一个<math> | | 该粗粒化方法包括五个步骤:1) 对TPM进行SVD分解;2)选择一个<math> |
| \epsilon | | \epsilon |
第385行: |
第384行: |
| \Phi</math>;以及 5) 利用<math> | | \Phi</math>;以及 5) 利用<math> |
| \Phi</math>和P得到新的TPM,使总静态通量保持不变。 | | \Phi</math>和P得到新的TPM,使总静态通量保持不变。 |
− | ===测试效果===
| + | ==测试效果== |
| 在图2 和图3 所示的所有示例中测试了此粗粒化方法。首先,对于根据图2(d) 和 (g) 所示的相同布尔网络模型生成的两个 TPM,其粗 TPM 分别如图2(f)和(i)所示。从TPM和投影矩阵<math> | | 在图2 和图3 所示的所有示例中测试了此粗粒化方法。首先,对于根据图2(d) 和 (g) 所示的相同布尔网络模型生成的两个 TPM,其粗 TPM 分别如图2(f)和(i)所示。从TPM和投影矩阵<math> |
| \Phi</math>中可以读出宏观布尔网络模型(图2(c))。值得注意的是,粗TPM中的<math> | | \Phi</math>中可以读出宏观布尔网络模型(图2(c))。值得注意的是,粗TPM中的<math> |
第409行: |
第408行: |
| \gamma | | \gamma |
| </math>大幅上升。这表明在粗粒化过程中损失了大量信息,同时可以得到一个相对更有效的小型网络模型,具有更强的归一化近似动态可逆性。 | | </math>大幅上升。这表明在粗粒化过程中损失了大量信息,同时可以得到一个相对更有效的小型网络模型,具有更强的归一化近似动态可逆性。 |
− | ==附录==
| + | =附录= |
| '''引理1:'''对于一个概率转移矩阵TPM <math>P=(P_{1},P_{2},...,P_{N})^{T}</math>,其中<math>P_{i}</math>是第i个行向量,那么: | | '''引理1:'''对于一个概率转移矩阵TPM <math>P=(P_{1},P_{2},...,P_{N})^{T}</math>,其中<math>P_{i}</math>是第i个行向量,那么: |
| | | |
第586行: |
第585行: |
| <math>\frac{\sum_{i=1}^{N} x_{i}^{\alpha}\cdot log x_{i}^{\alpha}}{\sum_{i=1}^{N} x_{i}^{\alpha}}\le log\sum_{i=1}^{N} x_{i}^{\alpha}.</math> | | <math>\frac{\sum_{i=1}^{N} x_{i}^{\alpha}\cdot log x_{i}^{\alpha}}{\sum_{i=1}^{N} x_{i}^{\alpha}}\le log\sum_{i=1}^{N} x_{i}^{\alpha}.</math> |
| | | |
− | ==参考文献==
| + | =参考文献= |
| <references /> | | <references /> |