更改

添加254字节 、 2024年7月27日 (星期六)
无编辑摘要
第1行: 第1行: −
'''NIS+(Neural Information Squeezer Plus)'''是一个机器学习框架,可学习宏观动力学,并量化因果涌现的程度。该框架通过最大化有效信息,得到一个宏观动态模型。通过在模拟数据和实际数据上的实验,证明了该框架的有效性。且该框架在不同测试环境里都表现出泛化的效果。
+
'''NIS+(Neural Information Squeezer Plus)'''是一个机器学习框架,可学习宏观动力学,并量化因果涌现的程度。该框架通过最大化有效信息,得到一个宏观动态模型。研究者通过在模拟数据和实际数据上的实验,证明了该框架的有效性。且该框架在不同测试环境里表现出更强的泛化能力。
    
= 问题背景 =
 
= 问题背景 =
在自然界和人类社会中,存在着许多由无数相互作用的元素构成的复杂系统,如气候系统、生态系统、鸟群、蚁群、细胞和大脑等。这些系统展现出丰富的非线性动力学行为,它们的行为模式复杂且难以预测。同时,复杂系统具有涌现现象,即系统的整体行为超越了其组成部分的简单总和,整体展现出其组成部分所不具备的新特性,这是理解宏观与微观之间关系的关键。<s>(复杂系统涌现)</s>
+
在自然界和人类社会中,存在着许多由无数相互作用的元素构成的复杂系统,如气候系统、生态系统、鸟群、蚁群、细胞和大脑等。这些系统展现出丰富的非线性动力学行为,它们的行为模式复杂且难以预测。复杂系统具有涌现现象,整体展现出其组成部分所不具备的新特性,这是理解宏观与微观之间关系的关键。<s>(复杂系统涌现)</s>
   −
涌现性与因果关系紧密相连。一方面,涌现性是系统内部各元素间复杂非线性相互作用的结果;另一方面,这些涌现的特性又会对系统中的个体产生影响。因果涌现描述了宏观层面相对于微观层面在因果效应上的增强,揭示了宏观与微观状态之间的差异和联系。
+
涌现现象与因果关系紧密相连。一方面,涌现性是系统内部各元素间复杂非线性相互作用的结果;另一方面,这些涌现的特性又会对系统中的个体产生影响。因果涌现这个概念最早由Erik Hoel正式提出并定义,即因果涌现描述了宏观层面相对于微观层面在因果效应上的增强,这揭示了宏观与微观状态之间的差异和联系。
   −
因果涌现的概念不仅将人工智能中的因果推理与复杂系统的涌现特性相结合,而且为解决一系列哲学问题提供了一个定量化的视角。<s>(涌现和因果)</s>
+
因果涌现的概念不仅将因果推理与复杂系统的涌现特性相结合,而且为解决一系列哲学问题提供了一个定量化的视角。<s>(涌现和因果)</s>
   −
目前,关于如何定义因果涌现,有四个主要代表,分别是:①Erik Hoel等基于粗粒化方法的因果涌现理论、②Rosas等基于信息分解的因果涌现理论、③张江等人基于奇异值分解的因果涌现理论、④Barnett L等的动力学解耦。具体内容可以参考词条[[因果涌现]]。<s>(因果涌现理论)</s>
+
目前,关于如何定义因果涌现,有四个主要代表,分别是:①Hoel等基于粗粒化方法的因果涌现理论、②Rosas等基于信息分解的因果涌现理论、③张江等人基于奇异值分解的因果涌现理论、④Barnett等的动力学解耦。具体内容可以参考词条[[因果涌现]]。<s>(因果涌现理论)</s>
    
== 因果涌现识别 ==
 
== 因果涌现识别 ==
 +
 +
现实中,当我们要应用涌现的量化框架时,会出现微观状态的数据难以获取、粗粒化策略不好确定的问题,所以,我们需要找到从可观测数据中直接识别因果涌现的方法。
    
识别出复杂系统中的因果涌现,一方面可以节约预测成本,增强预测效果,尤其是泛化效果;一方面也可以诱导或者预防涌现的发生。在实际应用中,一些微观数据难以捕捉,我们往往只能收集到观测数据,并且,无法得到系统的真实动力学。因此,从可观测数据中识别系统中因果涌现的发生是一个关键的问题。近年来,基于神经网络的机器学习方法取得了突破性进展,借助此方法,以数据驱动的方式自主发现复杂系统的因果关系甚至动力学成为可能。此外,机器学习和神经网络还可以帮助我们找到更好的粗粒化策略、从数据中发现宏观层面的因果关系。<s>(数据驱动)</s>
 
识别出复杂系统中的因果涌现,一方面可以节约预测成本,增强预测效果,尤其是泛化效果;一方面也可以诱导或者预防涌现的发生。在实际应用中,一些微观数据难以捕捉,我们往往只能收集到观测数据,并且,无法得到系统的真实动力学。因此,从可观测数据中识别系统中因果涌现的发生是一个关键的问题。近年来,基于神经网络的机器学习方法取得了突破性进展,借助此方法,以数据驱动的方式自主发现复杂系统的因果关系甚至动力学成为可能。此外,机器学习和神经网络还可以帮助我们找到更好的粗粒化策略、从数据中发现宏观层面的因果关系。<s>(数据驱动)</s>
第18行: 第20行:  
=== 基于信息分解的因果涌现识别 ===
 
=== 基于信息分解的因果涌现识别 ===
   −
Rosas等学者通过将过量熵(即系统现在与未来状态的互信息)分解成不重叠的部分来识别量化因果涌现,且提出了判定因果涌现发生的充分条件,当<math>\mathrm{\Psi}>0 </math>时,宏观状态<math>V </math>会发生涌现。
+
Rosas等学者通过将过量熵(excess entropy)分解成不重叠的部分来识别量化因果涌现,且提出了判定因果涌现发生的充分条件。
    
为了简化问题且不失通用性,以有两个输入变量(X<sub>1</sub>、X<sub>2</sub>)和一个输出变量(Y)的系统为例,目标变量和联合源变量的互信息<math>I(X_1,X_2; Y) </math>可以通过部分信息分解(Partial Information Decomposition,简称PID)分解成三种信息,分别是冗余信息(Redundant information,简称Red)、独特信息(Unique information,简称Un)、协同信息(Synergistic information,简称Syn),具体公式如下:
 
为了简化问题且不失通用性,以有两个输入变量(X<sub>1</sub>、X<sub>2</sub>)和一个输出变量(Y)的系统为例,目标变量和联合源变量的互信息<math>I(X_1,X_2; Y) </math>可以通过部分信息分解(Partial Information Decomposition,简称PID)分解成三种信息,分别是冗余信息(Redundant information,简称Red)、独特信息(Unique information,简称Un)、协同信息(Synergistic information,简称Syn),具体公式如下:
第27行: 第29行:       −
不过,PID只适用于单个目标变量的情景,无法有效的应用于跨时间步长的系统。故,Rosas等学者提出了集成信息分解(Integrated Information Decomposition,简称ΦID)。在给定宏观状态<math>V </math>的情况下,如果宏观变量(V<sub>t</sub>)所持有的关于微观变量独特信息大于0,则出现因果涌现。
+
不过,PID只适用于单个目标变量的情景,无法有效的应用于跨时间步长的系统。故,Rosas等学者提出了整合信息分解(Integrated Information Decomposition,简称ΦID)。当且仅当协同信息大于0的时候,系统有能力发生因果涌现。
 +
 
 +
 
 +
<math>Syn(X_{t};X_{t+1})  > 0 </math>
 +
 
 +
 
 +
 
 +
在给定宏观状态<math>V </math>的情况下,<math>Syn(X_{t};X_{t+1}) ≥ Un(V_t;X_{t+1}|X_t) </math>。所以,如果宏观变量(V<sub>t</sub>)所持有的关于微观变量独特信息大于0,则出现因果涌现。
 +
 
      第46行: 第56行:  
由于<math>Red(V_t, V_{t+1};X_t) </math>为非负数,所以可以提出一个充分非必要条件<math>\Psi_{t, t+1}(V) </math>,用于测量两个时间步宏观变量的互信息减去每个t时刻微观变量和t+1时刻宏观变量的互信息。
 
由于<math>Red(V_t, V_{t+1};X_t) </math>为非负数,所以可以提出一个充分非必要条件<math>\Psi_{t, t+1}(V) </math>,用于测量两个时间步宏观变量的互信息减去每个t时刻微观变量和t+1时刻宏观变量的互信息。
   −
当<math>\Psi_{t, t+1}(V) > 0 </math>,宏观状态<math>V </math>发生因果涌现。但当<math>\mathrm{\Psi}<0 </math>,我们不能确定宏观状态<math>V </math>是否发生因果涌现。
+
当<math>\Psi_{t, t+1}(V) > 0 </math>,系统发生因果涌现。但当<math>\mathrm{\Psi}<0 </math>,我们不能确定系统是否发生因果涌现。
 +
 
     
259

个编辑