计算力学
计算力学(Computational Mechanics)是一套数学框架,试图从历史序列中寻找、总结规律,并预测未来这一“智能活动”背后的一般规律。计算力学从信息论出发,定义出模式,因果态,各态之间的转换等重要概念,并将智能抽象为所谓的ϵ-机器。有学者从理论上证明,ϵ-机器可以展现出极大的预测能力和极小的复杂性。
此研究领域由圣塔菲研究所的詹姆斯.P.克拉奇菲尔德(James P. Crutchfield)所开创,北京师范大学系统科学学院教授张江,在参加圣塔菲研究所2007暑期夏令营(SFI 2007 Beijing Summer School)的过程中,结识了克拉奇菲尔德和他的同伴Shalizi,并对计算力学展开了讨论,互相向在座的各位提供了洞察力。此后十多年的一段时间该领域文献的解读和出版相对沉寂,而张江老师仍致力于复杂性科学、人工智能领域的知识服务工作。最终张江老师不忘科研初心,立志建立复杂系统科研的新高地,于是在2021年底在成功注册“集智俱乐部”实体的基础上,连续举办了一系列复杂系统相关的读书会。而计算力学的若干文献则在《因果涌现读书会》得到解读,相关研究者趋之若鹜。借着《因果涌现读书会》的春风,计算力学也迎来新的历史发展机遇。
计算力学的早期工作涉及“量化涌现(The Calculi of Emergence)”,试图对复杂系统、统计物理、热力学的某个尺度进行度量。随后克拉奇菲尔德和他的同伴,发现并证明用因果态表征[math]\displaystyle{ \epsilon-machine }[/math]定义下的深度(热力学复杂度或统计复杂度),能提供计算力学范畴的最小复杂度和最佳预测性,是复杂度理想化的一处浅滩。若想了解更多,请加入《因果涌现读书会》参与相关课题的研究和讨论。
历史渊源
圣塔菲研究所的詹姆斯.P.克拉奇菲尔德(James P. Crutchfield)在1989年 - 2001年期间,以香农信息论,和其他跨学科理论为基础,发布了一系统文献,提出了计算力学的概念。其中包括:
- 1989 《Inferring Statistical Complexity》[1]
- 1994 《The Calculi of Emergence: Computation, Dynamics, and Induction》[2]
- 1997 《Computational Mechanics of Cellular Automata: An Example》[3]
- 2001 《Computational Mechanics: Pattern and Prediction, Structure and Simplicity》[4]
这些文献使用了信息论当中各式熵的定义,包括信息熵、联合熵、条件熵和互信息熵。各个熵之间存在一定的计算关系,其中条件熵即为联合熵减去作为条件变量的熵。另外还引用了熵率的概率,熵率是指字符串长度逐渐趋于∞时,字符串的平均信息熵的极限值。在此基础上,计算力学大量使用了信息论的基本公式做了一些证明,还做了一定的扩展。在2001年的一篇文献中,证明过程相对完整。
北京集智科学研究中心的张江老师2022年借助《因果涌现读书会》的机会,将克拉奇菲尔德的计算力学领域相关论文和读书会成员共同解读,其中一位讲者使用了拉普拉斯守护者的语言来作为开场白,阐述了作为观测者对环境的感知的相关内容。其中有两场读书会对计算力学的文献做了深度解读,并结合复杂科学的相关领域展开了讨论。
简介
研究对象
自然和人工之物当中,存在偶然与必然的成分。在其之外,存在与环境交互的机制。计算力学研究事物和斑图形成的原因,以极大的能力和极小的复杂性,有效预测事物和模式的演变。
问题背景
众所周知,自然界中广泛存在各种物质及其运动,物质本身和运动轨迹,都呈现出一定程度的模式和斑图。在十七世纪,牛顿力学是关于物质、力与运动的基本原理;而人工智能时代,科学爱好者们需要理解信息、计算与预测背后的基本原理。**计算力学**这门结合了复杂网络、信息论的理论框架,有助于解决抽象提取各类现象背后的基本原理的问题。
理论框架
定义一:厄普西隆机器(ϵ\epsilon - Machine),可用于捕捉斑图和模式。
[math]\displaystyle{ \epsilon - machine = \{\mathbfcal{S}, \mathbf{T}\} }[/math]
其中,[math]\displaystyle{ \mathbfcal{S} }[/math]是因果涌现里粗粒化后的宏观态,即计算力学里的因果态;[math]\displaystyle{ \mathbf{T} }[/math]是状态转换概率分布张量,在因果科学的马尔科夫转移矩阵的基础上,再联合微观态的单步跃迁,共同耦合构成跨层级的概率分布张量。
如果用于预测,ϵ-机器的统计复杂度[math]\displaystyle{ C_1(\mathbfcal{S}) }[/math]极小。 在符号上,[math]\displaystyle{ label/index }[/math]为当前位置,[math]\displaystyle{ \overset{\to}{\mathbf{S}} }[/math]为符号串未来的预测结果,详见因果态和统计复杂度部分内容。
科学生态
本篇文章在于系统介绍和讲解计算力学方方面面的内容,对其他学科有相互引用和论证的地方,甚至是直接使用其他复杂科学已研究得出的结论。这篇文章并不假设读者已熟知相关内容,所以作者在此将所需各学科关键知识点列出,供读者在阅读本篇计算力学介绍文章时,随时查阅。相信各位科学和理论爱好者,在各研究机构的鼎力帮助下,能够一定程度掌握计算力学所需的复杂科学知识,并建立自己的理论体系。
本文有对计算力学的一般性介绍,读者可以用这部分内容对计算力学做一般性了解。特别地,本文也包含了计算力学整体理论更为严谨的论证过程。为了阐明这些论证过程,并使其严格化,作者们引用了论证过程形式化的框架,包括网络科学和符号与整数对应的哥德尔数。最终在这些形式化框架上,我们会完成计算力学整个体系较为完整的理论认证。
在实例部分,我们也试图分三步走。第一步:先分析实例的具体问题,做相应层次的掌握,把握好关键点之间的前后关系,并使用对应量化方法采集数据。第二步:对先前采集的数据的关系做一定的抽象,提取核心知识体系,完成实例对应的理论上形式化方法。第三步:在此理论状态空间对实例的具体问题开展演算,识别其涌现出的斑图。如有必要,就在理论层面做一些预测。
计算机科学
有限状态自动机
网络科学
复杂科学
牛顿力学解决了2个物体间相互作用力问题,而更多物体间的相互作用,则难以回答,况且不同尺度和视角下的物体组分和相互作用并不完全相同。复杂科学则和人工智能一起,并称为二十一世纪的科学,对生物系统和社会经济系统,都有着至关重要的作用。
因果涌现
宏观态
微观态
粗粒化
数学
离散数学
近世(抽象)代数
群的同构
形式语言
符号f,g是函数,也可理解成映射和变换,它作用到输入x或y或z上,形式化成f(x)或g(y)。左右小括号()表示函数的作用范围,作用范围内,可以填入运行参数。前述操作可以是更高阶的,即对于相同的输入,可以作用多次。多次且相同的作用,我们称为指数次或幂次,记为[math]\displaystyle{ f^n, n \in \Z^+ }[/math]。 例如:
[math]\displaystyle{ f_3f_2f_1(x) \tag {1} }[/math]
其中[math]\displaystyle{ f_1,f_2,f_3 }[/math]为相同的作用,数学上之所以没有写成[math]\displaystyle{ f_1 = f_2 = f_3 }[/math],估计是因为一般函数接受输入作为参数,带给我们的主要印象是变化。
可以记为
[math]\displaystyle{ f^3(x), \tag {2} }[/math]
也可以记为
[math]\displaystyle{ f^n(x), n=3. \tag {3} }[/math]
对于不同的函数(映射、变换)和作用,一般习惯使用不同的符号,比同f和g。它们可以先后依次作用于某种输入,作为形式语言的参数,比如有输入x待被5次映射:
[math]\displaystyle{ \Box_5\Box_4\Box_3\Box_2\Box_1(x) \tag {4} }[/math]
我们可以填空并实例化为
[math]\displaystyle{ f_5f_4g_3f_2f_1(x) \tag {5} }[/math]
再整理成:
[math]\displaystyle{ f^2g^1f^3(x) \tag {6} }[/math]
以上是函数的形式化。对于输入同样可以形式化,即输入也可以有多位,且可以不断拆分和聚合。这时我们一般用大写的X表示输入整体,输入的每个元素用小写的x,并且将元素赋予下标(索引),从而得出:
[math]\displaystyle{ f(x_1x_2x_3) \tag {7} }[/math]
令[math]\displaystyle{ X=x_1x_2x_3 }[/math],7式也可写为:
[math]\displaystyle{ f(X) \tag {8} }[/math]
这只是形式语言的基本内容,后续会补充相应文字和公式。
形式论证
哥德尔数([math]\displaystyle{ G\ddot{o}del\ number }[/math])
信息论
状态空间
微观态的粒子经过粗粒化,投射到观测者的时空图中,每个点是一个状态,附带着无限历史和热力学深度。这样一个高维多尺的抽象我们称为状态空间。 划分(映射)
μ-阶划分(映射)
倍周期 编码、解码
因果态是理想,具有良好的性质,证明过程基于信息论和数学中的等式和不等式。无论等式或不等式,都可以形式证据链条,从而触发层次机器重构,形成涌现。
数理空间
欧几里德空间
狭义和广义相对论空间
函数空间
集合空间
幂集
关系
状态空间
计算力学将符号动力系统微观态的符号,划分成有效态、因果态、和竞争态。我们将对这个划分操作做详细一些的介绍。
符号串的拆分
符号动力系统微观态的符号,先拆分到幂集。
符号串的聚合
符号串被拆分到幂集后,按对未来的预测分布,重新聚合,整个过程称为划分(粗粒化)。
有效态(effective state)
有效态(effective state)能捕捉斑图和模式,在统计复杂度意义上没有因果态(Causal State)简洁。
因果态(causal state)
因果态(causal state)蕴涵有非常优良的秉性。因果态来自于计算力学的划分方法的结果,要求是先对符号做幂集,对幂集中的每个元素,如果对未来预测相同,则聚合成同一个集合,命名为因果态。因果态是符号(最小元素)的集合的集合。在计算力学框架中,因果态也是一种有效态。
在因果涌现和NIS框架中,有类似的方法。其框架中,先对微观态使用最小化EI做粗粒化。严格的对应过程,我们需要先将二者进行理论上的抽象,进行算法的形式化。验证通过后,再将计算力学的最小元素(符号串)输入到NIS+框架中,看各自算法的输出结果。二者输入输出的张量结构可能会有差异,具体内容有待进一步讨论。
竞争态(prescient rival)
是预测能力和因果态相当的一种状态粒粗化方法,经证明他们只能是因果态的进一步细化。
状态转换
概率分布张量
计算力学的状态空间包含状态转换概率分布张量,标签化的状态转换概率[math]\displaystyle{ T_{ij}^{(s)} }[/math]被定义为宏观态由Si转换到Sj,同时微观态转换到s的概率。
[math]\displaystyle{ T_{ij}^{(s)} \equiv P(\mathcal{S}' = \mathcal{S}_j, \overset{\to 1}{S} = s \vert \mathcal{S} = \mathcal{S}_i) }[/math]
转换概率分布张量还可以加入阶次,那么转换概率分布张量T的属性可以是有序对(μ,i,j,s)。在状态转换图中,连接概率矩阵(张量)可以用符号[math]\displaystyle{ \mathbf{T}_{μ,ij}^{(s)}=\{P_{s,ij}^μ\} }[/math]代替。
转换概率分布张量的阶次为0时,且仅考虑宏观态的状态转换,即一个宏观态的所有微观态(s)汇聚到一起,转换概率分布张量也可以理解为有向图的连接矩阵。
迭代与递归
移位映射
伯努利移位映射
随机变量转确定过程
微观视角:[math]\displaystyle{ \omega_1\omega_2\omega_3\dots }[/math]
[math]\displaystyle{ \sigma : \Omega \mapsto \Omega }[/math]
[math]\displaystyle{ \sigma(\omega_1\omega_2\omega_3\dots) \mapsto \omega_2\omega_3\omega_4\dots }[/math]
宏观视角:确定过程
复杂度
符号[math]\displaystyle{ C_{μ} }[/math]
μ依赖于测度和分布
统计复杂度可用于线性系统的复杂性量化,也可用于非线性动态系统中复杂系统因果涌现复杂性的量化。香农熵基于概率分布,但对于确定性混沌却有些不足,统计复杂度则能量化宏观态上出现的确定性混沌。
统计复杂度(statistical complexity)是复杂系统深度的量化方式之一,用[math]\displaystyle{ C_{\mu} }[/math]符号来表示。其中μ依赖于测度和分布。跟统计力学中的量化理论有关,基于测度系统的定义。在部分混沌物理学的文献中,也被记作α。
在1989年《Inferring Statistical Complexity》[1]这篇文献里,复杂度的阶次符号为α,在2001年《Computational Mechanics: Pattern and Prediction, Structure and Simplicity》[4]中的符号为μ,这里我们统一使用μ。
Renyi信息和熵
μ-阶图复杂度
μ-阶图复杂度即为μ-阶图的概率算术复杂度,[math]\displaystyle{ C_{μ=0}=\log \lvert \mathbf{V} \rvert }[/math]。其中[math]\displaystyle{ \mathbf{V} }[/math]为μ-阶图的顶点集合。
在集智俱乐部的《因果涌现读书会》因果几何上,会做更详细的介绍,有编程经验的可以认为是有限状态机。
0-阶图复杂度([math]\displaystyle{ C_{μ=0} }[/math])和蔡汀-柯尔莫哥洛夫复杂度不同,0-阶图复杂度带有概率分布且依赖带有随机整数寄存器的图灵机。
μ-阶图复杂度([math]\displaystyle{ C_{μ} }[/math])是区别于信息论的量化复杂度的方法,后者基于维度[math]\displaystyle{ d_μ }[/math]和熵[math]\displaystyle{ h_μ }[/math]。
柯式复杂度
拓扑复杂度
当μ-阶图复杂度的μ为零时,μ-阶图复杂度也称为拓扑复杂度。由ϵ-机器的物征值给出。
统计复杂度
μ-阶图复杂度的μ = 1时,复杂度的量化方式为统计复杂度,带有热力学的“高温限制”。这里的统计复杂度也是1-阶图复杂度,即为香农熵。由ϵ-机器的物征向量给出。 统计复杂度(statistical complexity)是复杂系统深度的量化方式之一,用[math]\displaystyle{ C_{\mu} }[/math]符号来表示。这里的对应于因果涌现量化(有效信息EI),统计复杂度[math]\displaystyle{ C_{\mu} }[/math]越小,有效信息EI越大。
统计复杂度的下界,从周期行为和频段耦合中得出,是带二阶项的相位转换。
因果态的统计复杂度
[math]\displaystyle{ C_μ(\mathbfcal{S}) \equiv H[\mathcal{R}] }[/math]
此公式可用于因果涌现量化(有效信息EI),统计复杂度[math]\displaystyle{ C_{\mu} }[/math]越小,有效信息EI越大。
其中μ跟统计力学中的量化理论有关,基于测度系统的定义。在部分混沌物理学的文献中,也被记作α。
过程的统计复杂度
过程的统计复杂度(Statistical Complexity of a Process)
[math]\displaystyle{ C_μ(\mathcal{O}) \equiv C_{\mu}[\mathbfcal{S}] }[/math]
更多复杂度度量方法
描述复杂度
计算机科学里有提到最小描述长度,
计算复杂度
学过编程的,书上都有教计算复杂度,符号一般用O(n)。可以简单地表示为此算法调用的基本计算单元的次数。如果一个程序对基本计算单元的调用次数不可控,有可能该程序的计算复杂度是指数型的,记为O(nx),其中x为指数项。软件工程师结合一些计算机和数学方法,通常能将计算复杂度降为O(log(n))型。使用计算机器生成相应序列的复杂程度,计算力学和因果涌现对应的物理过程考虑二类机器:一类是图灵机,一类是ϵ-机器。ϵ-机器带有扰动,在NIS+框架中,扰动由用作编码器的可逆神经网络的丢弃维度和用作解码器的可逆神经网络引入的维度所构成。
层次机器重构
模式识别
因果涌现识别
模式预测
因果涌现预测
机器学习
随着数据的增长,计算机器也会越来越复杂,逐渐突破原有层级,达到新的层级。当今OpenAI的ChatGPT可以当作是字符生成器。
厄普西隆(ϵ)机器
此机器可以有效捕获模式,形式为有序对[math]\displaystyle{ \left \{ \epsilon, \mathbf{T} \right \} }[/math]。可以是信息源的生成机器,也可以是信息目的地重构出的机器。
ϵ-机器和图灵机不同,简单的图灵机是一种完全抽象的计算模型,它被实例化为冯·诺依曼架构,是现代计算机的理论模型。ϵ-机器可以通过和环境的互动,不断理解环境,更新自己的内秉属性,引入固定和随机变量而重构出来。
厄普西隆(ϵ)机器的统计力学描述
实例
混沌动力学
逻辑斯谛(Logistic)映射
逻辑斯谛(Logistic)映射求取迭代函数的极值,此极值可能呈现单周期、倍周期等现象。
元胞自动机
元胞自动机的复杂度的量化可使用0-阶图复杂度,即算术复杂度。
数字经济
链接全球创新网络资源,构建世界各地科研矩阵,助力探索超大型城市可持续发展创新政策、路径和在地解决方案,共同构建更智慧、更绿色、更有韧性、更可持续的数字未来。
参考文献
- ↑ 1.0 1.1 James P. Crutchfield, Karl Young. Inferring Statistical Complexity. PHYSICAL REVIEW LETTERS, VOLUME 63, NUMBER 2. 10 JULY 1989
- ↑ James P. Crutchfield. The Calculi of Emergence: Computation, Dynamics, and Induction. SFI 94-03-016. 1994
- ↑ James E. Hanson, James P. Crutchfield. Computational Mechanics of Cellular Automata: An Example. SFI WORKING PAPER: 1995-10-095
- ↑ 4.0 4.1 Cosma Rohilla Shalizi, James P. Crutchfield. Computational Mechanics: Pattern and Prediction, Structure and Simplicity. February 1, 2008
编者推荐
下面是一些链接能够帮助读者更好的了解计算力学的相关信息:
因果涌现读书会
读书会通过阅读前沿文献,加深我们对因果、涌现等概念的理解;聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。并探索复杂系统多尺度自动建模的研究方向。分享近期发展起来的一些理论与工具,包括因果涌现理论、机器学习驱动的重整化技术,以及自指动力学正在发展一套跨尺度的分析框架等。
涌现与因果的结合创造了因果涌现的概念。这是一套利用因果性来定量刻画涌现的理论体系,本季读书会通过阅读前沿文献,加深我们对因果、涌现等概念的理解;聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。第二季读书会更加集中在探讨因果科学与因果涌现之间的关系,以及对涌现进行定量刻画,聚焦于寻找因果与涌现、多尺度等概念相结合的研究方向;并探索复杂系统多尺度自动建模的研究方向。
因果涌现第三季的读书会中,将进一步围绕因果涌现的核心研究问题『因果涌现的定义』以及『因果涌现的辨识』来进行深入的学习和讨论,对 Erik Hoel 提出的 Causal Emergence,Causal Geometry 等因果涌现的核心理论进行深入的探讨和剖析,并且详细梳理其中涉及到的方法论,包括从动力学约简、隐空间动力学学习等其他研究领域中学习和借鉴相关的研究思路,最后探讨因果涌现的应用,包括基于生物网络、脑网络或者涌现探测等问题展开扩展,发掘更多的实际应用场景。