第22行: |
第22行: |
| 下面我们用一些例子来说明对涌现不同层次的描述。 | | 下面我们用一些例子来说明对涌现不同层次的描述。 |
| | | |
− | 涌现通常被理解为一个过程,该过程导致出现的结构并未直接由控制系统的定义约束和瞬时力描述。随着时间的推移,“新特征”出现在运动方程直接指定的尺度之外。比如一堆随机运动的粒子,虽然瞬时力可以用运动方程描述,但是从宏观尺度上会表现出压强、体积以及温度等“新特征”。我们需要明确涌现的“特征”是什么以及它“新”在哪里。否则涌现这一概念几乎没有内容,因为几乎任何时间依赖的系统都会表现出宏观特征。
| + | 涌现通常被理解为一个过程,该过程导致出现的结构并未直接由控制系统的定义约束和瞬时力描述。随着时间的推移,“新特征”出现在运动方程直接指定的尺度之外。比如一堆随机运动的粒子,虽然瞬时力可以用运动方程描述,但是从宏观尺度上会表现出压强、体积以及温度等新特征。我们需要明确特征是什么以及它新在哪里。否则这一概念几乎没有内容,因为几乎任何时间依赖的系统都会表现出涌现特征。 |
| | | |
− | 举两个例子来说明斑图涌现的特征,一个例子是确定性混沌,确定性运动方程随着时间的推移导致了看似不可预测的行为。系统从初始条件映射到后来的状态,变得极为复杂,以至于观察者既无法足够准确地测量系统,也无法以足够的计算能力预测未来的行为。这种混沌的涌现既是非线性动力学系统复杂行为的产物,也是观测者能力的限制。另一个例子是二维的自避免随机游走,粒子的逐步行为由随机方程直接规定:每次移动时,它朝随机方向移动,除非是刚刚离开的方向。经过一段时间,结果是路径描绘出一个自相似的分形结构。在这种情况下,分形结构从大部分随机的逐步运动中涌现出来。
| + | 举两个例子来说明斑图涌现的特征,一个例子是确定性混沌,确定性运动方程随着时间的推移导致了看似不可预测的行为。系统从初始条件映射到后来的状态,变得极为复杂,以至于观察者既无法足够准确地测量系统,也无法以有限的计算资源预测未来的行为。这种混沌的涌现既是非线性动力学系统复杂行为的产物,也是观测者能力的限制。另一个例子是二维的自避免随机游走,粒子的逐步行为由随机方程直接规定:每次移动时,它朝随机方向移动,除非是刚刚离开的方向。经过一段时间,结果是路径描绘出一个自相似的分形结构。在这种情况下,分形结构从大部分随机的逐步运动中涌现出来。 |
| | | |
− | 第一个例子的新增特征是不可预测性;第二个例子则是自相似性。在这两种情况下的“新颖性”都因其涌现特征与系统的定义特征直接对立而加剧:完全的确定性在混沌下隐藏,而几乎完全的随机性下则显现出自相似性的有序性。但这种涌现发生在谁的眼中?更具体地说,这些涌现特征对谁而言是“新”的?混沌动力学系统的状态在应用确定性函数时总是移动到唯一的下一个状态。显然,系统状态并不知道它的行为是不可预测的。对于随机游走,“分形性”不在执行局部步骤的粒子“眼中”,这本身就是定义上的,两种情况下的新颖性都在于系统外的观察者眼中。
| + | 第一个例子的新增特征是不可预测性;第二个例子则是自相似性。在这两种情况下的新颖性都因其涌现特征与系统的定义特征直接对立而加剧:完全的确定性在混沌下隐藏,而几乎完全的随机性下则显现出自相似的有序性。但这些涌现特征对谁而言是“新”的呢?混沌动力学系统的状态在应用确定性函数时总是移动到唯一的下一个状态。显然,系统状态并不知道它的行为是不可预测的。对于随机游走,“分形特征”不在执行局部步骤的粒子“眼中”,这本身就是定义上的,两种情况下的新颖性都在于系统外的观察者眼中。 |
| | | |
− | 实际上,检测到的斑图通常是通过观察者选择的统计数据来隐含假定的,可能某些“斑图”的功能表现与现象的数学模型一致,但这些模型本身依赖于一系列理论假设。简而言之,在斑图形成领域,“斑图”通常是被猜测出来的,观察者通过固定的规律库预期这些结构,然后再进行验证。类似于通信频道的类比,观察者就像是一个已经手握密码本的接收者。任何未能通过密码本解码的信号本质上都是噪声,即观察者未能识别的斑图。
| + | 实际上,检测到的斑图通常是通过观察者选择的统计数据来隐含假定的,可能某些斑图的功能表现与现象的数学模型一致,但这些模型本身依赖于一系列理论假设。简而言之,在斑图形成领域,斑图通常是被猜测出来的,观察者通过固定的规律库预期这些结构,然后再进行验证。类似于通信频道的类比,观察者就像是一个已经手握密码本的接收者。任何未能通过密码本解码的信号本质上都是噪声,即观察者未能识别的斑图。 |
| | | |
− | 在系统内部的协调行为中,有一种斑图涌现变得重要,即这些斑图在系统的其他结构中显现其“新颖性”。由于没有外部的参照来定义新颖性或斑图,我们可以将这个过程称为“内在”涌现。在高效资本市场中,竞争性个体根据从集体行为中涌现出的最优定价控制其个人生产-投资和股票所有权策略。对于个体的资源配置决策而言,通过市场的集体行为涌现出的价格是准确的信号,“完全反映”了所有可用信息,这一点至关重要。内在涌现的独特之处在于形成的斑图赋予了额外的功能性,支持全局信息处理,如设定最优价格。这种方法的不同之处在于,它基于显式的方法来检测嵌入在非线性过程中的计算。更具体地说,以下假设是,在内在涌现过程中,内在计算能力的增加可以被利用,从而赋予系统额外的功能性。
| + | 在系统内部的协调行为中,有一种斑图涌现变得重要,即这些模式在系统的其他结构中显现其“新颖性”。由于没有外部的参照来定义新颖性或斑图,我们可以将这个过程称为内在涌现。在高效资本市场中,竞争性主体根据从集体行为中涌现出的最优定价控制其个人生产-投资和股票所有权策略。对于主体的资源配置决策而言,通过市场的集体行为涌现出的价格是准确的信号,完全反映了所有可用信息,这一点至关重要。内在涌现的独特之处在于形成的斑图赋予了系统额外的功能性,支持全局信息处理,如设定最优价格。这种方法的不同之处在于,它基于显式的方法来检测嵌入在非线性过程中的计算。更具体地说,以下假设是,在内在涌现过程中,内在计算能力的增加可以被利用,从而赋予系统额外的功能性。 |
| | | |
− | === 进化的系统模型=== | + | === '''进化的系统模型''' === |
− | 可以用生物进化的思想来解释内在涌现的问题,一个高度有序系统是怎么从混沌中涌现的。但是它在解释目前生命形式的多样性方面所起的作用不那么具有预测性。因此将宇宙视为一个确定性动力系统(DS),并把它简化为包括一个环境和一组适应性的观察者或“智能体”。智能体(Agent)是一个随机动力系统(SDS),它试图构建和维持一个对其环境具有最大预测能力的内部模型。每个智能体的环境是其他智能体的集合。在任何给定的时刻,智能体的感知系统是当前环境状态的投影。也就是说,环境状态被智能体的感官装置所隐藏。随着时间的推移,感官装置产生一系列测量,这些测量引导智能体利用其可用资源(下图的基质)来构建内部模型。基于内部模型捕捉到的规律,智能体通过效应器采取行动,最终改变环境状态。如果智能体可以将测量结果尽可能划分随机和确定的部分,然后尽可能捕捉确定的规律,智能体就能利用环境中的更多规律,这种优势会提高智能体的生存能力。
| + | 可以用生物进化的思想来阐述内在涌现的问题,解释一个高度有序系统是怎么从混沌中涌现的,但是它在解释生命形式的多样性方面预测能力有限。因此要将系统限制在一个结构和生物特征明确的宇宙,并把它简化为包括一个环境和一组适应性的观察者或“智能体”。这样才能清晰地定义智能体的性质。智能体(Agent)试图构建和维持一个对其环境具有最大预测能力的内部模型。每个智能体的环境是其他智能体的集合,可以视为一个随机动力系统(Stochastic Dynamical Systems,简称SDS)。在任何给定的时刻,智能体感知到的是当前环境状态的投影。也就是说,环境状态被智能体的感官装置(传感器)所隐藏。随着时间的推移,感官装置产生一系列测量,这些测量引导智能体利用其可用资源(下图的基层)来构建内部环境模型。基于环境模型捕捉到的规律,智能体通过效应器采取行动,最终改变环境状态。如果智能体可以将测量结果尽可能划分随机和确定的部分,然后尽可能捕捉确定的规律,智能体就能利用环境中的更多规律,这种优势会提高智能体的生存能力。 |
| + | [[文件:宇宙模型示意图.jpg|居中|无框|600x600像素]] |
| | | |
− | ==复杂度量化==
| |
| | | |
− | ===度规升维===
| + | 上图为以智能体为中心的环境视图:宇宙可以被视为一个确定性动力系统(Deterministic Dynamical Systems,简称DS)。每个智能体所看到的环境是一个由所有其他智能体组成的随机动力系统(SDS)。其表观随机性源于是内在的随机性和有限的计算资源。每个智能体本身也是一个随机动力系统,因为它可能会从其基层和环境刺激中采样或受到无法控制的随机性困扰。基层代表支持和限制信息处理、模型构建和决策的可用资源。箭头表示信息流入和流出智能体的方向。 |
| | | |
− | 计算复杂度也可认为是[[算术复杂度]],理论上可以简化到二值计算。二值是符号里的0和1,是计算学所用的基本单位。通过组合0和1可以形成复杂的数学和逻辑,以及加入编解码器形成字符串。计算力学将经典[[复杂科学]]理论的部分核心“将自然过程二分为秩序和噪声”吸收了进来,也是相关文献<ref name=":1">James P. Crutchfield. The Calculi of Emergence: Computation, Dynamics, and Induction. SFI 94-03-016. 1994</ref>提到的创新方式。即我们可以利用[[复杂科学]]的粗粒化方法,将隐藏在自然现象中的过程压缩到极简的秩序(order,符号0)和随机(randomness,符号1),然后制定相应的运算法则,就能完成一种二值计算系统的建立,有兴趣的读者可以参阅[[布尔代数]]的相关内容。
| + | 智能体面临的基本问题是基于对隐藏环境状态的建模和选择可能的行动来预测未来的感官输入。设计这样一个原型宇宙的人面临的问题是如何判断智能体是否已适应环境及其适应方式。这需要一个量化的理论来描述智能体如何处理信息和构建模型。 |
| | | |
− | 在人工环境中使用二分法时,原始的随机过程,经过一定程度的累积,依赖于具体的粗粒化方法,有可能会呈现出一定的分布,导致计算复杂性的出现。这种计算复杂性经过抽象和形式化,使用不同的实体和规则,能形成不同的复杂度度量方法。但终究我们要具有将度规升维的能力,尊重现实,才能找到更佳的方案。
| + | == 模型的量化指标 == |
| | | |
− | ===柯式复杂度=== | + | === '''香农熵率''' === |
| + | <nowiki>柯式复杂度[math]\displaystyle{ K(x) }[/math]是指在通用确定性图灵机(UTM)上运行时输出的最小程序所需的比特数。不同的程序语言描述同一程序的[math]\displaystyle{ K(x) }[/math]是可以比较的,但也无法确定哪种程序语言有最小的[math]\displaystyle{ K(x) }[/math],如果描述不同程序时程序语言的[math]\displaystyle{ K(x) }[/math]也各不相同,所以柯式复杂度通常是不可计算的。如果待测对象是由信息源(例如马尔可夫链)生成的离散符号序列[math]\displaystyle{ s^L }[/math] ,[math]\displaystyle{ L }[/math]为序列的长度,其柯式复杂度的香农熵率[math]\displaystyle{ h_μ }[/math]为:[math]\displaystyle{ \frac{K\left(s^{L}\right)}{L}\underset{L\to\infty}{\operatorname*{\operatorname*{\operatorname*{\rightarrow}}}}h_{\mu} }[/math],转化为公式形式为:[math]\displaystyle{ h_\mu=\lim_{L\to\infty}\frac{H(\Pr(s^L))}L }[/math],其中[math]\displaystyle{ Pr(s^L) }[/math]是[math]\displaystyle{ s^L }[/math]的边际分布,[math]\displaystyle{ H }[/math]是自信息的平均值,在建模框架中,[math]\displaystyle{ h_μ }[/math]是信息不确定性程度的归一化指标,信息的不确定性越高,香农熵率越大。在这里可以解释为智能体在预测序列[math]\displaystyle{ s^L }[/math]的后续符号时的误差率。</nowiki> |
| | | |
− | [[柯式复杂度]]是大家普遍公认的复杂度度量方法,在Jean-Paul Delahaye和Hector Zenil对复杂系统量化方法研究的工作中<ref name=":5">Jean-Paul Delahaye, Hector Zenil. Towards a stable definition of Kolmogorov-Chaitin complexity. Fundamenta Informaticae XXI 1–15. 2008</ref>,认为最天然的计算设备的模型需要有一定的表达能力,并定义一个字符串s对于通用图灵机U的'''柯尔莫哥洛夫-蔡汀(Kolmogorov-Chaitin)复杂度'''<math>K_{u}(s)</math>为输出该字符串s的最短程序p的二进制长度。 | + | === '''统计复杂度''' === |
| + | 粗略地说,柯式复杂度[math]\displaystyle{ K(x) }[/math]需要考虑对象中的所有比特,包括随机比特。其主要后果是[math]\displaystyle{ K(x) }[/math]中数值[math]\displaystyle{ x }[/math]被随机性的生成所主导,因此掩盖了对象以及其生成过程中的重要结构。相比之下,统计复杂度[math]\displaystyle{ C_μ(x) }[/math]剔除了通用图灵机在模拟中随机比特时所花费的计算努力。统计复杂度的一个定义性特征是,对于理想随机对象[math]\displaystyle{ C_μ(x)=0 }[/math],同时对于简单的周期性过程,如[math]\displaystyle{ x=00000000…0 }[/math]时,也有[math]\displaystyle{ C_μ(x)=0 }[/math]。因此,统计复杂度的值对于(简单的)周期性过程和理想随机过程都很小。如果[math]\displaystyle{ s^L }[/math]表示[math]\displaystyle{ x) }[/math]的前[math]\displaystyle{ L }[/math]个符号,那么复杂性之间的关系简单地为: |
| | | |
− | <math>
| + | [math]\displaystyle{ K(s^L )≈C_μ (s^L )+h_μ L }[/math] |
− | K_{u}(s) = min\{\lvert p \rvert, U(p) = s \}
| |
− | </math>
| |
| | | |
− | 下标u是对应通用图灵机的代号,U是运行程序p的通用图灵机的实体。
| + | 如果在已确定描述语言(程序)的情况下,柯式复杂度[math]\displaystyle{ K(s^L ) }[/math]可以理解为描述[math]\displaystyle{ s^L }[/math]所用的总信息量。[math]\displaystyle{ h_μ L }[/math]为允许损失的随机信息量。统计复杂度[math]\displaystyle{ C_μ (s^L ) }[/math]可以理解为允许存在误差率[math]\displaystyle{ h_μ }[/math]的情况下,描述[math]\displaystyle{ s^L }[/math]所用的最少信息量。 |
| | | |
− | 为提高通用性,忽略各图灵机之间的差异,将柯氏复杂度定义进一步定义为:
| + | 在下图中,展示了柯式复杂度和统计复杂度在从简单周期性到理想随机的过程中的差异。如图(a)所示,确定性复杂性是过程中的理想随机度的单调递增函数,它由过程的香农熵率决定。相反,统计复杂度在两个极端点上均为零,并在中间达到最大值(见图(b))。在中等随机度的“复杂”过程是有序和随机计算元素的组合。组成过程的不可简约组件越多,过程就越“复杂”。 |
| + | [[文件:复杂度比较.jpg|居中|无框|600x600像素]] |
| | | |
− | <math>
| |
− | K(x) := C_m(x) = min\{ \lvert \lang M,w \rang \rvert: 通用计算机M在输入w时停机并输出x \}
| |
− | </math>
| |
− |
| |
− | 按照前式标准化为:
| |
− |
| |
− | <math>
| |
− | K(x) := C_m(x) = min\{ \lvert \lang M,w \rang \rvert: M(w) = x \}
| |
− | </math>
| |
− |
| |
− | 这里的w等于前式的p,即输出x的程序源代码字符串。x等于前式的s,即待输出的字符串。
| |
− |
| |
− | 在文献<ref name=":5">Jean-Paul Delahaye, Hector Zenil. Towards a stable definition of Kolmogorov-Chaitin complexity. Fundamenta Informaticae XXI 1–15. 2008</ref>中确定柯式复杂度的定义时,使用了两种不同的计算模型:
| |
− | *确定性图灵机(deterministic Turing machines (TM))。能够模拟神经元,一般以串行方式运行代码。
| |
− | *一维元胞自动机(CA)。以并行方式同时更新单个时间步上的所有元胞。
| |
− | 做了计算性能的比较,实验结果显示两者有着很强的相互关联,而且两者均可将输出字符串构成支持反转和补余操作的对称群。
| |
− |
| |
− | 柯式复杂度的主要注解包括因为停机问题而导致的不可计算性,以及它高度依赖编程语言的选择。虽然柯式复杂度有上述问题,但仍能揭示计算和模拟的本质。不同的计算模型形成了复杂度的分水岭,又来到常量E的一处浅滩:
| |
− |
| |
− | 定理:总能找到一个常量E,对于任意的字符串s,两种计算模型U1和U2的柯式复杂度满足:
| |
− |
| |
− | <math>
| |
− | \lvert K_{U_1}(s) - K_{U_2}(s) \rvert < E
| |
− | </math>
| |
− |
| |
− | 即,在误差条件E以内,有程序P能让计算模型U1模拟U2,智能体能借助程序P沿着复杂度的沟壑通向2050。
| |
− |
| |
− | ===统计复杂度===
| |
− |
| |
− | 定义及符号<math>C_{μ}</math>
| |
− |
| |
− | 下标μ依赖于测度和分布,同柯式复杂度<math>C_{u}</math>的下标u含义不完全相同,对应的计算模型M的分类和分布,也依赖于具体的理论实现。
| |
− |
| |
− | 统计复杂度可用于线性系统的[[复杂性]]量化,也可用于非线性动态系统中复杂系统[[因果涌现]][[复杂性]]的量化。香农熵基于概率分布,但对于确定性混沌却有些不足,统计复杂度则能量化宏观态上出现的确定性混沌。
| |
− |
| |
− | 统计复杂度(statistical complexity)是复杂系统深度的量化方式之一,用<math>C_{\mu}</math>符号来表示。其中μ依赖于测度和分布。跟统计力学中的量化理论有关,基于测度系统的定义。在部分混沌物理学的文献中,也被记作α。
| |
− |
| |
− | 在1989年《Inferring Statistical Complexity》<ref name=":0"></ref>这篇文献里,复杂度的阶次符号为α,在2001年文献<ref name=":3"></ref>中的符号为μ,这里我们统一使用μ。
| |
− |
| |
− | μ-阶图复杂度
| |
− |
| |
− | μ-阶图复杂度即为μ-阶图的概率算术复杂度,<math>C_{μ=0}=\log \lvert \mathbf{V} \rvert</math>。其中<math>\mathbf{V}</math>为μ-阶图的顶点集合。
| |
− |
| |
− | 在集智俱乐部的《因果涌现读书会》[[因果几何]]上,会对连续系统的因果涌现做更详细的介绍,有兴趣的可以参考下。
| |
− |
| |
− | 0-阶图复杂度(<math>C_{μ=0}</math>)和蔡汀-柯尔莫哥洛夫复杂度不同,0-阶图复杂度带有概率分布且依赖带有随机整数寄存器的图灵机。
| |
− |
| |
− | μ-阶图复杂度(<math>C_{μ}</math>)是区别于信息论的量化复杂度的方法,后者基于维度<math>d_μ</math>和熵<math>h_μ</math>。
| |
| | | |
| + | 图(a)为柯式复杂度,是对信息源不可预测程度的度量。它表示可以通过香农熵率来衡量的随机性程度。图 (b) 统计复杂统计基于这样的观点:随机性在统计上是简单的:一个理想的随机过程具有零统计复杂度。在另一端,简单的周期性过程具有较低的统计复杂度。复杂过程在这些极端之间产生,并且是可预测机制和随机机制的混合。 |
| | | |
| + | === '''香农熵率和统计复杂度的定量计算''' === |
| | | |
| 拓扑复杂度 | | 拓扑复杂度 |