计算力学

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
涌现仿真讨论 | 贡献2024年8月27日 (二) 16:15的版本 →‎涌现关系 对齐和纠正也是一种关系
跳到导航 跳到搜索

计算力学(Computational Mechanics)是一套数学框架,试图从历史序列中寻找、总结规律,并预测未来这一“智能活动”背后的一般规律。计算力学从信息论出发,定义出模式,因果态,各态之间的转换等重要概念,并将智能抽象为所谓的ϵ-机器。有学者从理论上证明,ϵ-机器可以展现出极大的预测能力和极小的复杂性。

历史渊源

圣塔菲研究所的詹姆斯.P.克拉奇菲尔德(James P. Crutchfield)在1989年 - 2001年期间,以香农信息论,和其他跨学科理论为基础,发布了一系统文献,提出了计算力学的概念。其中包括:

  • 1989 《Inferring Statistical Complexity》[1]
  • 1994 《The Calculi of Emergence: Computation, Dynamics, and Induction》[2]
  • 1997 《Computational Mechanics of Cellular Automata: An Example》[3]
  • 2001 《Computational Mechanics: Pattern and Prediction, Structure and Simplicity》[4]

这些文献使用了信息论当中各式熵的定义,包括信息熵、联合熵、条件熵和互信息熵。各个熵之间存在一定的计算关系,其中条件熵即为联合熵减去作为条件变量的熵。另外还引用了熵率的概率,熵率是指字符串长度逐渐趋于∞时,字符串的平均信息熵的极限值。在此基础上,计算力学大量使用了信息论的基本公式做了一些证明,还做了一定的扩展。在2001年的一篇文献中,证明过程相对完整。

北京集智科学研究中心的张江老师2022年借助《因果涌现读书会》的机会,和读书会成员共同解读了克拉奇菲尔德的计算力学领域相关论文。针对复杂度的度量进行了深入分析,整理了层次机器重构算法,并结合复杂科学的相关领域展开了讨论。

问题背景

涌现现象

众所周知,自然界中广泛存在各种物质及其运动,物质本身和运动轨迹,都呈现出一定程度的模式和斑图。在十七世纪,牛顿力学是关于物质、力与运动的基本原理;主体(观察者)需要理解信息、计算与预测背后的基本原理。**计算力学**这门结合了复杂网络信息论的理论框架,有助于解决抽象提取各类现象背后的基本原理的问题。

在牛顿力学提出以后,掀起了一轮科技工业革命,人们逐渐走向科学时代,对自然现象有了全新的理解。一些现象可以解释为物体间力的相互作用,且物理学家们对作用力的大小和物体状态的改变建立联系,使用方程的形式来表达。自此人们对自然的认识空间的进步,遇到很多现象也不再迷茫,能够更多地把握事物的运动规律。这种力的相互作用,表现形式十分多样,物理学家们做了一些基本的分类。这些分类一般基于相应的科研成果,再归类到原子层面的效应原理。科学家们基于这些成果,做了大量的观测和研究,不断发现力的大小随距离远近发生变化,变化的趋势和范围都跟元素周期和同位素有关。

然而这只是元素级别的力学现象,这些现象出现在元素级别,并不能完全反映到另外的级别,比如我们在不借助电子显微镜,只借助人眼的条件下进行观测,很多现象不能简单地归结为元素间的相互作用,或者说很难用元素间的相互作用,来直接表现宏观层面的相关模式。比如在水里组团游动的鱼群,他们的游动方向很难用各自的距离保持这个因素来表示。再比如生物圈,从山水林田湖草沙,到羊牛蚊蝇兔狗猪,都很难从单个物种来做一些属性判别。这时往往需要借助新的科技手段,来对这些模式进行深入研究,发现其潜在的原理和规律。

一般对涌现现象定义为不能简单归结为元素间的相互作用力,而需要从对应层面来描述的现象,认为是涌现。如果建立了促成这种涌现现象发生的机理的算法模型,则细化为因果涌现,是随附了宏观动力学的一类涌现。这种涌现往往比微观层面更强,在Erol Hoel的理论框架中,用有效信息EI来度量因果涌现效应的强弱。在计算力学框架中,则在某些层面将“新颖”就归结为“涌现”,而这些新颖的东西就是需要在旧有的理论框架上做补充,或者要么建立新的框架。新颖的东西能在因果涌现框架上不断地出现,最终能被宏观动力学方程[math]\displaystyle{ \Phi(x) }[/math]和计算力学原理所捕捉。

自然界中(Nature)或宇宙(Prototype Universe)中总是处在不断变化之中,这也是相对的。在这种相对变化的环境中,可能出现确定性或稳定性,导致观测者可以被存在。这时观测者和特定的稳定环境出现相互依赖,观测者对特定环境之外投入的关注视情况而定。观测者对该稳定环境中出现的微扰会加以关心,直到微扰变得可测量且足够充分,超过某一阈值,使得群落对该现象都表达过关心。达到相变程度后,涌现现象即产生,但群落中的观测者对相变后的环境仍会继续观测,改变内生涌现斑图,或启动单个或群落的效应器,使得环境的多个指标重新落入某个范围。这种差额机制即可用于对比,也可用于对齐。在生态群落多级系统中,则要定义“正”的概念和范围,以判断“偏”的存在性。

涌现关系

自然存在是一个世界,主体(观察者)是世界的子集的同时,主体也会在内部构建一个世界的映象。这个过程本身从定性上来讲,也是一种涌现现象。计算力学选择建立从自然到主体,再从主体到涌现(头脑风暴),最后主体增加适应性的角度来阐述关系。

计算力学理论框架中,有关的文献将极大的环境称为宇宙,其下是环境和智能体。本篇文章中,将原始文献的三级模型压缩为二级,将宇宙和环境整合成新的环境,以方便使用二分法。经过这种整合后,自然世界被划分成环境和智能体,分别嵌入确定性动力系统和随机动力系统。智能体(Agent)是一类观测者(Observer),能从自然界涌现出的斑图解析出来,从而得到智慧,进而改善智能体内部对环境的模拟,从而不断提高适应性。如果智能体对环境斑图的解析是正确的,则这种解析计算能力可能会被加强,使对环境的适应性呈现增强的状态。

上述对涌现和观测者的描述会遇到一定的困难,或者说削弱了斑图涌现的含义。如果我们认为斑图被观测者A识别,然后当成涌现,固有的内在涌现就难以定义了。为了解决这个困难,我们使用一些形式化方法,将环境中斑图的涌现当成“The emergence of pattern”,而将智能体A识别的涌现当成“The emergence of pattern”的相,即“The emergence of pattern in Agent A”。这个“The emergence of pattern in Agent A”将会塑造“Agent A”,也可能会成为“Agent A”的序参数,使得“Agent A”内部不断强化这个相。当将视角转向世界模型中的其他观测者(也可能是智能体),比如智能体B,它除了能捕捉环境中的“The emergence of pattern”外,还会发现被“The emergence of pattern in Agent A”塑造过的“Agent A”,而被塑造过的“Agent A”因为有了序参数,而本身又成为一种涌现的斑图,存在于智能体B的环境中。

所以在计算力学中,涌现的关系形式化为:涌现的斑图EP,被观测者A,即智能体A,捕捉成[math]\displaystyle{ Image_{an} = Agent_a(EP) }[/math],从而塑造[math]\displaystyle{ Agent_a }[/math][math]\displaystyle{ Agent_a(Image_{an} = Agent_a(EP)) }[/math]。同时涌现的斑图EP,也会被智能体B,捕捉成[math]\displaystyle{ Image_{bn} = Agent_b(EP) }[/math],而智能体A的固有涌现[math]\displaystyle{ Agent_a(Image_{an} = Agent_a(EP)) }[/math]也被智能体B识别成[math]\displaystyle{ Image_{ba} = capture(Agent_a(Image_{an} = Agent_a(EP))) }[/math],使得智能体B成为[math]\displaystyle{ Agent_b(Image_{bn} = Agent_b(EP), Image_{ba})) }[/math]。这种形式化仅考虑了映射的输入和输出,具体的智能体的随机动力学会在相应部分展开。

在这里,我们可以有下列术语:

  • Nature,缩写为n,即环境。
  • Agent,智能体,可以有多个,其序号用下标表示。
  • Capture,智能体对斑图涌现的进行识别。
  • Image,智能体对斑图涌现的识别出的相,可以认为是智能体知识体系中的一条规则。下标为哪个智能体捕捉谁的斑图。

一个环境和多个智能体形成的复杂网络,涌现的斑图有些无法从两两关系中得出。

自然环境和智能体关系的示意图

自然环境中各元素涌现出的斑图,经物理极微观态通信信道被智能体识别,智能体启动内因检查,增强或削弱内生斑图,然后完成理想目标的模拟,满足群落计算的完备性(Closure),形成计算和信息的流网络,促进智能体的完整适应,可作为计算力学形式化的优化目标之一。计算力学的结构来源于统计,产生于二分计算,自然环境为生,真空环境为丧。有了对比就有了“新颖”和“不适”,智能体初始只能选自然环境。在检测到位于边缘时,启动警示和调节机制,将自己拉回到自然环境。当群落形成时,计算中可舍弃部分微观态的历史,使得稳定发展成为主流,从而时刻准备着完成更高阶的完备性。

第0阶的完整性可以说是维持自己存在于自然环境,这种完整性信息输入和能量消耗极小,这几点可以形成计算的结构和导致斑图的涌现。

由于扰动的存在,形式语言的字符串很少单独出现在环境中,所以除了智能体的识别涌现斑图外,还有将其他智能体拉回微扰的智能体和机制,使得能在混沌动力学中找出周期的存在,智能体各方面保持相对稳定性。

统计复杂度

柯式复杂度

柯式复杂度是大家公认的复杂度度量方法,在文献《Towards a stable definition of Kolmogorov-Chaitin complexity》[5]中,定义是一个字符串s对于通用图灵机U的柯尔莫哥洛夫-蔡汀(Kolmogorov-Chaitin)复杂度[math]\displaystyle{ K_{u}(s) }[/math]定义为输出该字符串s的最短程序p的二进制长度。

[math]\displaystyle{ K_{u}(s) = min\{\lvert p \rvert, U(p) = s \} }[/math]

下标u是对应图灵机的代号。

柯式复杂度的主要缺点是因为停机问题而导致的不可计算性,针对K式复杂度的主要评论是它高度依赖编程语言的选择。

为提高通用性,忽略各图灵机之间的差异,将柯氏复杂度定义进一步定义为:

[math]\displaystyle{ K(s) := C_U(x) = min\{ \lvert \lang M,w \rang \rvert: 图灵机M在输入w时停机并输出x \} }[/math]

按照前式标准化为:

[math]\displaystyle{ K(s) := C_U(x) = min\{ \lvert \lang M,w \rang \rvert: M(w) = x \} }[/math]

这里的w等于前式的p,即输出x的程序源代码字符串。

统计复杂度

定义及符号[math]\displaystyle{ C_{μ} }[/math]

μ依赖于测度和分布

统计复杂度可用于线性系统的复杂性量化,也可用于非线性动态系统中复杂系统因果涌现复杂性的量化。香农熵基于概率分布,但对于确定性混沌却有些不足,统计复杂度则能量化宏观态上出现的确定性混沌。

统计复杂度(statistical complexity)是复杂系统深度的量化方式之一,用[math]\displaystyle{ C_{\mu} }[/math]符号来表示。其中μ依赖于测度和分布。跟统计力学中的量化理论有关,基于测度系统的定义。在部分混沌物理学的文献中,也被记作α。

在1989年《Inferring Statistical Complexity》[1]这篇文献里,复杂度的阶次符号为α,在2001年《Computational Mechanics: Pattern and Prediction, Structure and Simplicity》[4]中的符号为μ,这里我们统一使用μ。

μ-阶图复杂度

μ-阶图复杂度即为μ-阶图的概率算术复杂度,[math]\displaystyle{ C_{μ=0}=\log \lvert \mathbf{V} \rvert }[/math]。其中[math]\displaystyle{ \mathbf{V} }[/math]为μ-阶图的顶点集合。

在集智俱乐部的《因果涌现读书会》因果几何上,会做更详细的介绍,有编程经验的可以认为是有限状态机。

0-阶图复杂度([math]\displaystyle{ C_{μ=0} }[/math])和蔡汀-柯尔莫哥洛夫复杂度不同,0-阶图复杂度带有概率分布且依赖带有随机整数寄存器的图灵机。

μ-阶图复杂度([math]\displaystyle{ C_{μ} }[/math])是区别于信息论的量化复杂度的方法,后者基于维度[math]\displaystyle{ d_μ }[/math]和熵[math]\displaystyle{ h_μ }[/math]


拓扑复杂度

当μ-阶图复杂度的μ为零时,μ-阶图复杂度也称为拓扑复杂度。由ϵ-机器的物征值给出。

统计复杂度

μ-阶图复杂度的μ = 1时,复杂度的量化方式为统计复杂度,带有热力学的“高温限制”。这里的统计复杂度也是1-阶图复杂度,即为香农熵。由ϵ-机器的物征向量给出。 统计复杂度(statistical complexity)是复杂系统深度的量化方式之一,用[math]\displaystyle{ C_{\mu} }[/math]符号来表示。这里的对应于因果涌现量化(有效信息EI),统计复杂度[math]\displaystyle{ C_{\mu} }[/math]越小,有效信息EI越大。

统计复杂度的下界,从周期行为和频段耦合中得出,是带二阶项的相位转换。

因果态的统计复杂度

[math]\displaystyle{ C_μ(\mathbfcal{S}) \equiv H[\mathcal{R}] }[/math]

此公式可用于因果涌现量化(有效信息EI),统计复杂度[math]\displaystyle{ C_{\mu} }[/math]越小,有效信息EI越大。

其中μ跟统计力学中的量化理论有关,基于测度系统的定义。在部分混沌物理学的文献中,也被记作α。

过程的统计复杂度

过程的统计复杂度(Statistical Complexity of a Process)

[math]\displaystyle{ C_μ(\mathcal{O}) \equiv C_{\mu}[\mathbfcal{S}] }[/math]

因果态

定义

因果态是一类函数中的一簇ϵ,能将过程历史的幂集映射到一系列历史的集合,这系列历史的集合的元素符合下述要求:

[math]\displaystyle{ ϵ(\overset{\leftarrow}{s}) \equiv \{\overset{\leftarrow '}{s} \vert P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow}{s}) = P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow '}{s}), 对所有的\ \overset{\to}{s} \in \overset{\to}{S}, \overset{\leftarrow '}{s} \in \overset{\leftarrow}{S} \} \tag{5} }[/math]

对因果态集合进行补充描述:第i个因果态记为[math]\displaystyle{ \mathcal{S}_i }[/math],所有因果态集合记为[math]\displaystyle{ \mathbfcal{S} }[/math],对应的随机变量记为[math]\displaystyle{ \mathcal{S} }[/math],它的一个实现为σ。

一种等价形式的要求为:

[math]\displaystyle{ ϵ(\overset{\leftarrow}{s}) \equiv \{\overset{\leftarrow '}{s} \vert P(\overset{\to L}{S} = \overset{\to L}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow}{s}) = P(\overset{\to L}{S} = \overset{\to L}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow '}{s}), \overset{\to L}{s} \in \overset{\to L}{S}, \overset{\leftarrow '}{s} \in \overset{\leftarrow}{S}, L \in \Z^+ \} \tag{6} }[/math]

性质

一个过程的因果态具有下述性质:

  • 对所有长度的未来具有强同质性;
  • 对未来的预测具有极大的精确性;
  • 具有极小的统计复杂度;
  • 除去测度为0的历史,因果态是唯一的。

生成算法

  • 将微观态历史序列转换成字符串序列,允许使用二进制或数字加字母;
  • 使用随机变量转确定过程算法将字符串序列映射到无限微观状态空间。[math]\displaystyle{ \sigma(\omega_1\omega_2\omega_3\dots) \mapsto \omega_2\omega_3\omega_4\dots }[/math]
  • 引入编号机制,将字符串序列进行排序;
  • 确定起始时刻t,

厄普西隆机器

厄普西隆机器(ϵ-machine) 此机器可以有效捕获模式,形式为有序对[math]\displaystyle{ \left \{ \epsilon, \mathbf{T} \right \} }[/math]。可以是信息源的生成机器,也可以是信息目的地重构出的机器。

ϵ-机器和图灵机不同,简单的图灵机是一种完全抽象的计算模型,它被实例化为冯·诺依曼架构,是现代计算机的理论模型。ϵ-机器可以通过和环境的互动,不断理解环境,更新自己的内秉属性,引入固定和随机变量而重构出来。

层次机器重构算法

层次机器

重构算法

1. 在最低水平上,设定0级模型为描述数据本身,即M0=s1s2s3...;

2. 从更低模型重构模型Ml=Ml-1/~,其中~表示l级上的因果等价类;操作的含义是,在l-1级上被区别对待的状态在l级上可以被视为同一个因果态。此时S和T都更新了;

3. 收集更多的数据,增大序列长度L,得到更加精确的一系列模型Ml

4. 如果随着L增大,模型的复杂度发散,即[math]\displaystyle{ \lVert M_l \rVert \to \infty }[/math],那么回到第二步,得到更高级模型Ml+1

5. 如果模型复杂度收敛,意味着重建好了一个合适的ϵ-机器,程序退出。

实例

逻辑斯谛映射

逻辑斯谛(Logistic)映射求取迭代函数的极值,此极值可能呈现单周期、倍周期等现象。

元胞自动机

元胞自动机的复杂度的量化可使用0-阶图复杂度,即算术复杂度。

数字经济

链接全球创新网络资源,构建世界各地科研矩阵,助力探索超大型城市可持续发展创新政策、路径和在地解决方案,共同构建更智慧、更绿色、更有韧性、更可持续的数字未来。

建立完备性的商业数字经济闭环,数字湾区,都市核心。水陆两用,低空蓄势。

参考文献

  1. 1.0 1.1 James P. Crutchfield, Karl Young. Inferring Statistical Complexity. PHYSICAL REVIEW LETTERS, VOLUME 63, NUMBER 2. 10 JULY 1989
  2. James P. Crutchfield. The Calculi of Emergence: Computation, Dynamics, and Induction. SFI 94-03-016. 1994
  3. James E. Hanson, James P. Crutchfield. Computational Mechanics of Cellular Automata: An Example. SFI WORKING PAPER: 1995-10-095
  4. 4.0 4.1 Cosma Rohilla Shalizi, James P. Crutchfield. Computational Mechanics: Pattern and Prediction, Structure and Simplicity. February 1, 2008
  5. Jean-Paul Delahaye, Hector Zenil. Towards a stable definition of Kolmogorov-Chaitin complexity. Fundamenta Informaticae XXI 1–15. 2008

编者推荐

计算力学和因果涌现关系密切,计算力学借鉴了因果涌现大量的概念、算法以及模型,并提出了因果态和统计复杂度概念和涌现的量化方法。下面是一些链接能够帮助读者更好的了解因果涌现的相关信息:

因果涌现读书会

读书会通过阅读前沿文献,加深我们对因果、涌现等概念的理解;聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。并探索复杂系统多尺度自动建模的研究方向。分享近期发展起来的一些理论与工具,包括因果涌现理论、机器学习驱动的重整化技术,以及自指动力学正在发展一套跨尺度的分析框架等。

涌现与因果的结合创造了因果涌现的概念。这是一套利用因果性来定量刻画涌现的理论体系,本季读书会通过阅读前沿文献,加深我们对因果、涌现等概念的理解;聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。第二季读书会更加集中在探讨因果科学与因果涌现之间的关系,以及对涌现进行定量刻画,聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。

因果涌现第三季的读书会中,将进一步围绕因果涌现的核心研究问题『因果涌现的定义』以及『因果涌现的辨识』来进行深入的学习和讨论,对 Erik Hoel 提出的 Causal Emergence,Causal Geometry 等因果涌现的核心理论进行深入的探讨和剖析,并且详细梳理其中涉及到的方法论,包括从动力学约简、隐空间动力学学习等其他研究领域中学习和借鉴相关的研究思路,最后探讨因果涌现的应用,包括基于生物网络、脑网络或者涌现探测等问题展开扩展,发掘更多的实际应用场景。

路径推荐