更改

跳到导航 跳到搜索
添加427字节 、 2024年8月20日 (星期二)
第54行: 第54行:  
对于如何定义因果涌现是一个关键问题,有几个代表性工作,分别是Hoel等<ref name=":0" /><ref name=":1" />提出的基于[[有效信息]]的方法、Rosas等<ref name=":5">Rosas F E, Mediano P A, Jensen H J, et al. Reconciling emergences: An information-theoretic approach to identify causal emergence in multivariate data[J]. PLoS computational biology, 2020, 16(12): e1008289.</ref>提出的基于信息分解的方法、张江等人<ref name=":2" />基于奇异值分解提出了一套新的因果涌现理论以及一些其他的理论。
 
对于如何定义因果涌现是一个关键问题,有几个代表性工作,分别是Hoel等<ref name=":0" /><ref name=":1" />提出的基于[[有效信息]]的方法、Rosas等<ref name=":5">Rosas F E, Mediano P A, Jensen H J, et al. Reconciling emergences: An information-theoretic approach to identify causal emergence in multivariate data[J]. PLoS computational biology, 2020, 16(12): e1008289.</ref>提出的基于信息分解的方法、张江等人<ref name=":2" />基于奇异值分解提出了一套新的因果涌现理论以及一些其他的理论。
 
====Erik Hoel的因果涌现理论====
 
====Erik Hoel的因果涌现理论====
Hoel等<ref name=":0" /><ref name=":1" />最早提出因果涌现理论,下图是对该理论框架的一个抽象,其中,横坐标表示时间,纵坐标表示尺度(Scale)。该框架可以看成是对同一个动力系统在微观和宏观两种尺度上的描述。其中,[math]f_m[/math]为微观动力学,[math]f_M[/math]为宏观动力学,二者通过一个粗粒化函数[math]\phi[/math]相连。在一般离散状态的马尔科夫动力系统中,[math]f_m[/math]和[math]f_M[/math]都是马尔科夫链,对[math]f_m[/math]进行[[马尔科夫链的简化]],就可以得到[math]f_M[/math]。[math]\mathcal{J}[/math]为[[有效信息]](<math> EI </math>)的度量。由于微观态可能具有更大的随机性,这导致微观动力学的[[因果性]]比较弱,所以通过对每一个时刻的微观态进行合理的粗粒化,就有可能得到因果性更强的宏观态。所谓的因果涌现,就是指当我们对微观态进行粗粒化的时候,宏观态动力学的[[有效信息]]量会增加这一现象,并且宏观态与微观态[[有效信息]]之差被定义为因果涌现的强度。
+
Hoel等于2013年<ref name=":0" /><ref name=":1" />提出因果涌现理论,下图是对该理论的一个抽象框架,其中,横坐标表示时间,纵坐标表示尺度(Scale)。该框架可以看成是对同一个动力系统在微观和宏观两种尺度上的描述。其中,[math]f_m[/math]表示微观动力学,[math]f_M[/math]表示宏观动力学,二者通过一个粗粒化函数[math]\phi[/math]相连。在一个离散状态的马尔科夫动力系统中,[math]f_m[/math]和[math]f_M[/math]都是马尔科夫链,对[math]f_m[/math]进行[[马尔科夫链的粗粒化]],就可以得到[math]f_M[/math]。[math]\mathcal{J}[/math]为[[有效信息]](<math> EI </math>)的度量。由于微观态可能具有更大的随机性,这导致微观动力学的[[因果性]]比较弱,所以通过对每一个时刻的微观态进行合理的粗粒化,就有可能得到因果性更强的宏观态。所谓的因果涌现,就是指当我们对微观态进行粗粒化的时候,宏观动力学的[[有效信息]]会增加这一现象,并且宏观态与微观态的[[有效信息]]之差被定义为因果涌现的强度。
    
[[文件:因果涌现理论.png|因果涌现理论框架|alt=因果涌现理论抽象框架|居中|400x400像素|缩略图]]
 
[[文件:因果涌现理论.png|因果涌现理论框架|alt=因果涌现理论抽象框架|居中|400x400像素|缩略图]]
   −
[[有效信息]]最早由[[Tononi]]等人在[[整合信息论]]的研究中提出<ref>Tononi G, Sporns O. Measuring information integration[J]. BMC neuroscience, 2003, 41-20.</ref>。在因果涌现研究中,[[Erik Hoel]]等人将这种[[因果效应度量]]指标用于量化一个[[因果机制]]的因果性强弱。具体来说,使用干预操作对自变量做[[干预]],并考察在这一干预下,因和果变量之间的[[互信息]],这种互信息就是[[有效信息]],即因果机制的因果效应度量。
+
[[有效信息]](EI)最早由[[Tononi]]等人在[[整合信息论]]的研究中提出<ref>Tononi G, Sporns O. Measuring information integration[J]. BMC neuroscience, 2003, 41-20.</ref>。在因果涌现研究中,[[Erik Hoel]]等人将这种[[因果效应度量]]指标用于量化一个[[因果机制]]的因果性强弱。
 +
 
 +
具体来说,EI的计算为:使用干预操作对自变量做[[干预]],并考察在这一干预下,因和果变量之间的[[互信息]],这种互信息就是[[有效信息]],即因果机制的因果效应度量。
    
在[[马尔科夫链]]中,任意时刻的状态变量[math]X_t[/math]都可以看作是原因,而下一时刻的状态变量[math]X_{t+1}[/math]就可以看作是结果,这样[[马尔科夫链]]的[[状态转移矩阵]]就是它的[[因果机制]]。因此,针对[[马尔科夫链]]的<math>EI</math>的计算公式如下所示:
 
在[[马尔科夫链]]中,任意时刻的状态变量[math]X_t[/math]都可以看作是原因,而下一时刻的状态变量[math]X_{t+1}[/math]就可以看作是结果,这样[[马尔科夫链]]的[[状态转移矩阵]]就是它的[[因果机制]]。因此,针对[[马尔科夫链]]的<math>EI</math>的计算公式如下所示:
第64行: 第66行:  
<math>
 
<math>
 
\begin{aligned}
 
\begin{aligned}
EI(f) &= I(X_t,X_{t+1}|do(X_t)\sim U(\mathcal{X}))=I(\tilde{X}_t,\tilde{X}_{t+1}) \\  
+
EI(f) \equiv& I(X_t,X_{t+1}|do(X_t)\sim U(\mathcal{X}))\equiv I(\tilde{X}_t,\tilde{X}_{t+1}) \\  
 
&= \frac{1}{N}\sum^N_{i=1}\sum^N_{j=1}p_{ij}\log\frac{N\cdot p_{ij}}{\sum_{k=1}^N  p_{kj}}
 
&= \frac{1}{N}\sum^N_{i=1}\sum^N_{j=1}p_{ij}\log\frac{N\cdot p_{ij}}{\sum_{k=1}^N  p_{kj}}
 
\end{aligned}
 
\end{aligned}
 
</math>
 
</math>
   −
其中f表示一个马尔科夫链的状态转移矩阵,[math]U(\mathcal{X})[/math]表示状态变量[math]X_t[/math]取值空间[math]\mathcal{X}[/math]上的均匀分布。<math>\tilde{X}_t,\tilde{X}_{t+1}</math>分别为把t时刻的[math]X_t[/math][[干预]]为[[均匀分布]]后,前后两个时刻的状态。<math>p_{ij}</math>为第i个状态转移到第j个状态的转移概率。从这个式子,不难看出,EI仅仅是概率转移矩阵[math]P[/math]的函数。进行干预操作是为了使得有效信息能客观衡量动力学的因果特性而不受原始输入数据的分布影响。
+
其中f表示一个马尔科夫链的状态转移矩阵,[math]U(\mathcal{X})[/math]表示状态变量[math]X_t[/math]取值空间[math]\mathcal{X}[/math]上的均匀分布。<math>\tilde{X}_t,\tilde{X}_{t+1}</math>分别为把t时刻的[math]X_t[/math][[干预]]为[[均匀分布]]后,前后两个时刻的状态。<math>p_{ij}</math>为第i个状态转移到第j个状态的转移概率。从这个式子不难看出,EI仅仅是概率转移矩阵[math]f[/math]的函数。进行干预操作是为了使得有效信息能客观衡量动力学的因果特性而不受原始输入数据的分布影响。
   −
有效信息可以拆解为[[确定性]][[简并性]]两部分,还可以通过引入归一化从而消除状态空间规模的影响。关于有效信息的详细信息请参看[[有效信息]]。
+
有效信息可以拆解为'''确定性''''''简并性'''两部分,还可以通过引入归一化从而消除状态空间规模大小的影响。关于有效信息的详细信息请参看词条:[[有效信息]]。
   −
我们可以通过比较系统中宏微观动力学的[[有效信息]]大小来判断因果涌现的发生:
+
我们可以通过比较系统中宏微观动力学的有效信息大小来判断因果涌现的发生:
    
<math>
 
<math>
第79行: 第81行:  
</math>
 
</math>
   −
如果通过有效的粗粒化使得宏观动力学的有效信息大于微观动力学的有效信息(也就是<math>CE>0</math>),那么我们认为在该粗粒化基础上宏观动力学具有因果涌现特性。
+
其中CE为因果涌现强度。如果宏观动力学的有效信息大于微观动力学的有效信息(也就是<math>CE>0</math>),那么我们认为在该粗粒化基础上宏观动力学具有因果涌现特性。
 +
 
 +
在文献<ref name=":0"/>中,Hoel给出一个含有8个状态的马尔科夫链的状态转移矩阵([math]f_m[/math]的例子,如图a所示。其中前7个状态之间等概率转移,最后一个状态是独立的,只能转变为自身的状态。
   −
在文献<ref name=":0"/>中,Hoel给出一个含有8个状态的马尔科夫链的状态转移矩阵例子,如图a所示。其中前7个状态之间等概率转移,最后一个状态是独立的,通过将前7个状态粗粒化成一个状态,可以得到右图所示确定的宏观马尔科夫转移矩阵,即系统的未来状态完全可以由当前状态决定。此时<math>EI(f_M\ )>EI(f_m\ ) </math>,系统发生了因果涌现。
+
对该矩阵的粗粒化为如下操作:首先,将前7个状态归并为一个宏观状态,不妨称为A,并且将[math]f_m[/math]中前7行的前7列的概率数值加总得到A到A状态转移的概率,并对[math]f_m[/math]矩阵的其它数值保持不变。这样归并后的新的概率转移矩阵如右图所示,记为[math]f_M[/math]。这是一个确定的宏观马尔科夫转移矩阵,即系统的未来状态完全可以由当前状态决定。此时<math>EI(f_M\ )>EI(f_m\ ) </math>,系统发生了因果涌现。
    
[[文件:状态空间中的因果涌现.png|居中|500x500像素|状态空间上的因果涌现|替代=|缩略图]]
 
[[文件:状态空间中的因果涌现.png|居中|500x500像素|状态空间上的因果涌现|替代=|缩略图]]
   −
另一个例子是一个[[布尔网络]]中发生因果涌现的例子<ref name=":0"/>中。如图所示,这是一个含有4个节点的布尔网络,每个节点有0和1两种状态,每个节点与另外两个节点相连,遵循相同的微观[[动力学机制]](a图)。因此,该系统一共含有十六个微观状态,它的动力学可以用一个<math>16\times16 </math>的状态转移矩阵(c图)表示。
+
另一个文献<ref name=":0"/>中的例子是一个[[布尔网络]]中发生因果涌现的例子。如图所示,这是一个含有4个节点的布尔网络,每个节点有0和1两种状态,每个节点与另外两个节点相连,遵循相同的微观动力学机制(a图)。因此,该系统一共含有十六个微观状态,它的动力学可以用一个<math>16\times16 </math>的状态转移矩阵(c图)表示。
    
进一步,如果我们给定分组方式,如将A和B进行合并,C和D进行合并(如b图所示),同时给定微观状态到宏观状态的映射函数(如d图所示),就可以得到一个新的宏观的布尔网络以及它的动力学机制,根据这个机制就可以得到宏观网络的状态转移矩阵(如e图所示)。通过对比,我们发现宏观动力学的[[有效信息]]大于微观动力学的[[有效信息]](<math>EI(f_M\ )>EI(f_m\ ) </math>),该系统发生了因果涌现。
 
进一步,如果我们给定分组方式,如将A和B进行合并,C和D进行合并(如b图所示),同时给定微观状态到宏观状态的映射函数(如d图所示),就可以得到一个新的宏观的布尔网络以及它的动力学机制,根据这个机制就可以得到宏观网络的状态转移矩阵(如e图所示)。通过对比,我们发现宏观动力学的[[有效信息]]大于微观动力学的[[有效信息]](<math>EI(f_M\ )>EI(f_m\ ) </math>),该系统发生了因果涌现。
 
[[文件:含有4个节点的布尔网络.png|居中|700x700像素|离散布尔网络上的因果涌现|替代=含有4个节点布尔网络的因果涌现|缩略图]]
 
[[文件:含有4个节点的布尔网络.png|居中|700x700像素|离散布尔网络上的因果涌现|替代=含有4个节点布尔网络的因果涌现|缩略图]]
   −
进一步,在<ref name="Chvykov_causal_geometry">{{cite journal|author1=Chvykov P|author2=Hoel E.|title=Causal Geometry|journal=Entropy|year=2021|volume=23|issue=1|page=24|url=https://doi.org/10.3390/e2}}</ref>一文中,Hoel等人提出了[[因果几何]]理论框架,试图将因果涌现理论推广到具有连续状态的马尔科夫动力系统之中,对[[随机函数映射]]定义了EI,同时还引入了干预噪音和[[因果几何]]的概念,并将这一概念与[[信息几何]]进行了对照和类比。[[刘凯威]]等人<ref name="An_exact_theory_of_causal_emergence">{{cite journal|author1=Liu K|author2=Yuan B|author3=Zhang J|title=An Exact Theory of Causal Emergence for Linear Stochastic Iteration Systems|journal=Entropy|year=2024|volume=26|issue=8|page=618|url=https://arxiv.org/abs/2405.09207}}</ref>又进一步给出了[[随机迭代动力系统]]的精确解析的因果涌现理论。
+
进一步,在<ref name="Chvykov_causal_geometry">{{cite journal|author1=Chvykov P|author2=Hoel E.|title=Causal Geometry|journal=Entropy|year=2021|volume=23|issue=1|page=24|url=https://doi.org/10.3390/e2}}</ref>一文中,Hoel等人提出了[[因果几何]]理论框架,试图将因果涌现理论推广到具有连续状态的马尔科夫动力系统之中,该文章对[[随机函数映射]]定义了EI,同时还引入了干预噪音和[[因果几何]]的概念,并将这一概念与[[信息几何]]进行了对照和类比。[[刘凯威]]等人<ref name="An_exact_theory_of_causal_emergence">{{cite journal|author1=Liu K|author2=Yuan B|author3=Zhang J|title=An Exact Theory of Causal Emergence for Linear Stochastic Iteration Systems|journal=Entropy|year=2024|volume=26|issue=8|page=618|url=https://arxiv.org/abs/2405.09207}}</ref>又进一步给出了[[随机迭代动力系统]]的精确解析的因果涌现理论。
    
====Rosas的因果涌现理论====
 
====Rosas的因果涌现理论====
642

个编辑

导航菜单