更改

添加591字节 、 2024年6月19日 (星期三)
更新到公式17,并且修正ϵ机制的写法
第15行: 第15行:       −
计算力学是一种方法,用来结构化复杂性,定义一个过程的因果态,并给出一个找出它们的步骤。我们揭示了因果态的表征-一个ε机制-拥有最小复杂度的同时又能拥有最准确的预测能力。我们在ε机制最优化和唯一性上,以及如何将ε机制同其他表征相比较上,获得了一些成果。更多结果和测量随机性和结构复杂度有关联,这些关联是从ε机制到一些遍历及信息理论获得的。
+
计算力学是一种方法,用来结构化复杂性,定义一个过程的因果态,并给出一个找出它们的步骤。我们揭示了因果态的表征-一个ε机制-拥有最小复杂度的同时又能拥有最准确的预测能力。我们在ϵ机制最优化和唯一性上,以及如何将ε机制同其他表征相比较上,获得了一些成果。更多结果和测量随机性和结构复杂度有关联,这些关联是从ε机制到一些遍历及信息理论获得的。
    
圣塔菲研究所 研究论文 99-07-044
 
圣塔菲研究所 研究论文 99-07-044
第94行: 第94行:  
转移概率
 
转移概率
   −
ε机制
+
ϵ机制
   −
ε机制的定义
+
ϵ机制的定义
   −
ε机制是系综
+
ϵ机制是系综
   −
ε机制是决定性的
+
ϵ机制是决定性的
    
因果态是无关的
 
因果态是无关的
   −
ε机制的重建
+
ϵ机制的重建
    
最优化和唯一性
 
最优化和唯一性
   −
ε机制可以最大化预测
+
ϵ机制可以最大化预测
   −
ε机制足够统计性
+
ϵ机制足够统计性
    
预测平替定义
 
预测平替定义
第122行: 第122行:  
因果态是唯一的
 
因果态是唯一的
   −
ε机制具有最小随机性
+
ϵ机制具有最小随机性
    
边界
 
边界
第152行: 第152行:  
时间反演
 
时间反演
   −
ε机制是幺半群
+
ϵ机制是幺半群
    
改进引理的另一种证明
 
改进引理的另一种证明
第189行: 第189行:  
有组织的物质在自然界中是广泛存在的,物理学的分支应该可以处理它-统计力学-只是缺乏一致性,原则性的方式去描述,测量,以及检测这么多自然展示出来的不同结构。统计力学有好的测量无序的热力学熵,以及相关的量化方法,比如自由能。当扩展关键模式和斑图形式的时候,它也能够拥有非常好的成功方法,来分析从对称性破缺中形成的斑图。在均衡态和最近的非均衡态都能应用。不幸的是,这些成功包含了很多技巧性处理——比如说猜测序参量,为扰动扩展标识小参量,和给空间拆分选择合适的功能基。目前这些方法还远不够清晰,还不能处理所有在自然界中遇到的多样性组织,特别是那些生物形成的过程。
 
有组织的物质在自然界中是广泛存在的,物理学的分支应该可以处理它-统计力学-只是缺乏一致性,原则性的方式去描述,测量,以及检测这么多自然展示出来的不同结构。统计力学有好的测量无序的热力学熵,以及相关的量化方法,比如自由能。当扩展关键模式和斑图形式的时候,它也能够拥有非常好的成功方法,来分析从对称性破缺中形成的斑图。在均衡态和最近的非均衡态都能应用。不幸的是,这些成功包含了很多技巧性处理——比如说猜测序参量,为扰动扩展标识小参量,和给空间拆分选择合适的功能基。目前这些方法还远不够清晰,还不能处理所有在自然界中遇到的多样性组织,特别是那些生物形成的过程。
   −
计算力学【5】是一种直接定位斑图、结构和组织议题的方法。同时保留了大家已经熟悉的统计力学的概念和数学工具,它同后者不同又补充了后者。在本质上,不管是从经验数据还是从行为的概率描述上,它都显示了怎样去推断一个生成观测到的行为隐藏过程的模型。这种表征——ε机制——用一种能反应过程因果结构的方式捕捉到观测数据中的斑图和法则。把这个模型放在手上,是很有用的,它能对观测到的原始数据进行外推,从而对将来的行为做出预测。更多的是,在一个良好定义的语境里,也是下面的一个主题:这个ε-机制对观测到的生成数据来说,是唯一最大有效的模型。
+
计算力学【5】是一种直接定位斑图、结构和组织议题的方法。同时保留了大家已经熟悉的统计力学的概念和数学工具,它同后者不同又补充了后者。在本质上,不管是从经验数据还是从行为的概率描述上,它都显示了怎样去推断一个生成观测到的行为隐藏过程的模型。这种表征——ε机制——用一种能反应过程因果结构的方式捕捉到观测数据中的斑图和法则。把这个模型放在手上,是很有用的,它能对观测到的原始数据进行外推,从而对将来的行为做出预测。更多的是,在一个良好定义的语境里,也是下面的一个主题:这个ϵ-机制对观测到的生成数据来说,是唯一最大有效的模型。
   −
ε-机制他们也揭示出,用一种直接的方式,信息是如何存储在过程中,以及存储的信息是怎样随新的输入和时间的流逝转换的。这也说明,不使用计算机来做仿真和数值计算,就使计算力学成为“力学”,在一种“计算理论”的语境里。
+
ϵ-机制他们也揭示出,用一种直接的方式,信息是如何存储在过程中,以及存储的信息是怎样随新的输入和时间的流逝转换的。这也说明,不使用计算机来做仿真和数值计算,就使计算力学成为“力学”,在一种“计算理论”的语境里。
   −
计算力学的基本想法在十年前介绍过。从那时起,他们用于用于动态系统,蜂窝自动化,隐式马尔可夫模型,改进的空间计算,随机共振,全局耦合的地图,和水龙头滴水实验。尽管有这些成功的应用记录,关于这个主题的数学基础,还存在一些不确定的东西。从结构方面来看,ε-机制在捕捉一个过程固有的斑图和用最小方式实现上,是很显然的,这个里面发表没有特定的证明。更多地,这里面还没有证明,如果ε-机制是以这种方式最优的,它是一个过程唯一的最优表征。这些微小需要的间隙已经补充上了。(译者注:间隙之所以little-needed,是因为想法提出以后,形成了一些成功样例,但是离完整证明还有一段距离。这段距离虽然有点微不足道 ,但也是需要的。本篇文章就来完成想法到证明到成功应用的完整过程。)对于那些(是有道理的)在一个过程的统计特征约束的议题,我们证明了ε-机制确实是唯一最优的因果模型(译者注:之所以谈到统计特征约束的议题,应该是证明结果可用于统计特征约束)。这些结果的严格证明是这篇文章的主要内容。我们给出最优结果的初步版本——但并不是唯一性理论,关于唯一性理论有新的文献——请移步参考文献【15】。
+
计算力学的基本想法在十年前介绍过。从那时起,他们用于用于动态系统,蜂窝自动化,隐式马尔可夫模型,改进的空间计算,随机共振,全局耦合的地图,和水龙头滴水实验。尽管有这些成功的应用记录,关于这个主题的数学基础,还存在一些不确定的东西。从结构方面来看,ϵ-机制在捕捉一个过程固有的斑图和用最小方式实现上,是很显然的,这个里面发表没有特定的证明。更多地,这里面还没有证明,如果ϵ-机制是以这种方式最优的,它是一个过程唯一的最优表征。这些微小需要的间隙已经补充上了。(译者注:间隙之所以little-needed,是因为想法提出以后,形成了一些成功样例,但是离完整证明还有一段距离。这段距离虽然有点微不足道 ,但也是需要的。本篇文章就来完成想法到证明到成功应用的完整过程。)对于那些(是有道理的)在一个过程的统计特征约束的议题,我们证明了ϵ-机制确实是唯一最优的因果模型(译者注:之所以谈到统计特征约束的议题,应该是证明结果可用于统计特征约束)。这些结果的严格证明是这篇文章的主要内容。我们给出最优结果的初步版本——但并不是唯一性理论,关于唯一性理论有新的文献——请移步参考文献【15】。
   −
本篇阐述的大纲按下述过程进行。我们先开始展示计算力学,在斑图,随机性,和因果上,是如何关联到其它方法的。这样做的要点也是将我们的注意力聚焦于统计系统中的斑图上,以及他们概率的表征。使用从信息论来的一些想法,我们为这些表征,陈述奥卡姆剃刀一个定量性的版本。在这一点上我们定义因果态,等价于行为类别,以及在因果态之间转换的结构——ε-机制。随后我们揭示从奥卡姆剃刀的角度看,因果态在获取最大可能预测上的能力,是理想的。更多是的,我们揭示了因果态是唯一最优的。这些结合优势让我们可以去证明,关联到ε-机制最优结果的,一系列其他内容。我们检查了在继承最优结果时做出的断言,同时我们备注了他们其中的一些可以在不需要过度扰乱理论的条件下获得提升。我们也在一个过程的内生力学上建立了边界,这些边界为ε-机制和定量化信息,以及遍历理论所揭示。最后,我们用回顾本篇展示了什么,以及在计算力学的数学基础上,什么可以视为许诺将来工作方向,来作为结束。
+
本篇阐述的大纲按下述过程进行。我们先开始展示计算力学,在斑图,随机性,和因果上,是如何关联到其它方法的。这样做的要点也是将我们的注意力聚焦于统计系统中的斑图上,以及他们概率的表征。使用从信息论来的一些想法,我们为这些表征,陈述奥卡姆剃刀一个定量性的版本。在这一点上我们定义因果态,等价于行为类别,以及在因果态之间转换的结构——ϵ-机制。随后我们揭示从奥卡姆剃刀的角度看,因果态在获取最大可能预测上的能力,是理想的。更多是的,我们揭示了因果态是唯一最优的。这些结合优势让我们可以去证明,关联到ϵ-机制最优结果的,一系列其他内容。我们检查了在继承最优结果时做出的断言,同时我们备注了他们其中的一些可以在不需要过度扰乱理论的条件下获得提升。我们也在一个过程的内生力学上建立了边界,这些边界为ϵ-机制和定量化信息,以及遍历理论所揭示。最后,我们用回顾本篇展示了什么,以及在计算力学的数学基础上,什么可以视为许诺将来工作方向,来作为结束。
    
一系列附录提供了附加材料,有信息论,等价关系和类,用于时间反演过程的ε-机制,半群理论,计算力学和其他领域的联系和区别。
 
一系列附录提供了附加材料,有信息论,等价关系和类,用于时间反演过程的ε-机制,半群理论,计算力学和其他领域的联系和区别。
第354行: 第354行:  
    如果有一种讨论将来的不确定性将是十分方便地。直观地这将是H[S->],但是在一般情况下数值是无限的,操作起来也是十分棘手的。(H[S->]是有限的特殊情形已经在附录F中处理过。)正常情况下,我们由考虑H[S->L]来回避这个问题,下L个符号的不确实性,由L的函数处理。在一些时候,我们将参考每一个符号的熵或熵速率【55,62】:
 
    如果有一种讨论将来的不确定性将是十分方便地。直观地这将是H[S->],但是在一般情况下数值是无限的,操作起来也是十分棘手的。(H[S->]是有限的特殊情形已经在附录F中处理过。)正常情况下,我们由考虑H[S->L]来回避这个问题,下L个符号的不确实性,由L的函数处理。在一些时候,我们将参考每一个符号的熵或熵速率【55,62】:
   −
<math>   
+
<math>
 
h[\overset{\to}{S}] \equiv \lim_{L \to \infty} \frac{1}{L} H[\overset{\to L}{S}]. \tag{9}
 
h[\overset{\to}{S}] \equiv \lim_{L \to \infty} \frac{1}{L} H[\overset{\to L}{S}]. \tag{9}
 
</math>
 
</math>
第408行: 第408行:  
     
 
     
 
    让我们引用奥卡姆剃刀原则:“有些事情只需抓住关键点,做得太多的话就是徒劳”【63】。为了使用剃刀,我们需要修正什么是“完成”和什么是“更多”和“更少”的含义。我们希望完成的工作是准确地预测,比如,尽可以地降低条件熵H[S->L|R]。目标就变成了获取由引理1导出的界限。我们希望尽可能简单地完成它,尽可能使用最少的资源。在见识过这两个约束的道路上——最小化不确定性和最小化资源——我们需要有第二者的测量方法。因为P(S<- = s<-)是定义好的,这里有一个在η-状态之上的简化测量方法;比如,P(R = ρ),处于任意单个实际状态的概率,也定义好了。对应地,我们定义资源的测量方法。
 
    让我们引用奥卡姆剃刀原则:“有些事情只需抓住关键点,做得太多的话就是徒劳”【63】。为了使用剃刀,我们需要修正什么是“完成”和什么是“更多”和“更少”的含义。我们希望完成的工作是准确地预测,比如,尽可以地降低条件熵H[S->L|R]。目标就变成了获取由引理1导出的界限。我们希望尽可能简单地完成它,尽可能使用最少的资源。在见识过这两个约束的道路上——最小化不确定性和最小化资源——我们需要有第二者的测量方法。因为P(S<- = s<-)是定义好的,这里有一个在η-状态之上的简化测量方法;比如,P(R = ρ),处于任意单个实际状态的概率,也定义好了。对应地,我们定义资源的测量方法。
   
+
 
 
定义4(因果态的复杂度)状态类R的统计复杂度是
 
定义4(因果态的复杂度)状态类R的统计复杂度是
   第420行: 第420行:  
当和收敛到一个有限值。
 
当和收敛到一个有限值。
   −
μ中Cμ中提示我们它有着量化理论的特性,并且最终依赖于过程序列的分布,能导出状态上的测量。
+
μ中<math>C_{μ}</math>中提示我们它有着量化理论的特性,并且最终依赖于过程序列的分布,能导出状态上的测量。
    
    一个状态类的统计复杂度是平均不确定度(单位是比特),在此过程的当前状态。这个,换句话说,是跟平均存储数量(单位是比特)一样,过程看上去是在保持过去,在给定选定的状态类R的条件下。(我们晚一点,在定义12中,查看如果定义一个过程它自己的统计复杂度。)这个目标是在尽可能少的存储下完成。再次申明,我们希望最小化统计复杂度,并符合最大准确预测的限制。
 
    一个状态类的统计复杂度是平均不确定度(单位是比特),在此过程的当前状态。这个,换句话说,是跟平均存储数量(单位是比特)一样,过程看上去是在保持过去,在给定选定的状态类R的条件下。(我们晚一点,在定义12中,查看如果定义一个过程它自己的统计复杂度。)这个目标是在尽可能少的存储下完成。再次申明,我们希望最小化统计复杂度,并符合最大准确预测的限制。
第438行: 第438行:  
定义5(一个过程的因果态)一个过程的因果态是一系列函数ε的成员,ε将S<-映射到2S<-——S<-的幂集:
 
定义5(一个过程的因果态)一个过程的因果态是一系列函数ε的成员,ε将S<-映射到2S<-——S<-的幂集:
   −
ε(s<-) = {s<-'|P(S->=s->|S<-=s<-) = P(S->=s-> | S<- = s<-'), 对所有s->∈S->,s<-'∈S<-},  (16)
+
<math>
 +
ϵ[\overset{\leftarrow}{S}] \equiv \{\overset{\leftarrow '}{s} \vert P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow}{s}) = P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow '}{s}), 对所有\ \overset{\to}{s} \in \overset{\to}{S}, \overset{\leftarrow '}{s} \in \overset{\leftarrow}{S} \} \tag{16}
 +
</math>
    
它将历史映射到历史集合,我们将第i个因果态写成Si,并将所有因果态的集合写成S;对应的随机变量描述成S,它的实现写为σ。
 
它将历史映射到历史集合,我们将第i个因果态写成Si,并将所有因果态的集合写成S;对应的随机变量描述成S,它的实现写为σ。
第444行: 第446行:  
    S的基数没有特别说明。S可以是有限的,可数无限的,一个连续体,一个康托集,或一些奇异定格。这些例子在参考文献【5】和【10】中给出;特别查阅那里给出的隐马尔可夫模型的例子。
 
    S的基数没有特别说明。S可以是有限的,可数无限的,一个连续体,一个康托集,或一些奇异定格。这些例子在参考文献【5】和【10】中给出;特别查阅那里给出的隐马尔可夫模型的例子。
 
     
 
     
    可替换的也是等价的,我们可以定义等价关系〜ε如两段历史是等价的当且仅当它们拥有相同的未来条件分布,并且定义因果态为由〜ε生成的等价类。(实际上,这是文献【6】的原始方法。)不管什么方法,S<-的这种划分的切分由区域建成,这些区域使我们在不同条件下对未来有一些无知。
+
    可替换的也是等价的,我们可以定义等价关系〜ϵ如两段历史是等价的当且仅当它们拥有相同的未来条件分布,并且定义因果态为由〜ε生成的等价类。(实际上,这是文献【6】的原始方法。)不管什么方法,S<-的这种划分的切分由区域建成,这些区域使我们在不同条件下对未来有一些无知。
   −
    最后的陈述建议了另一种,仍然等价,对ε的描述:
+
    最后的陈述建议了另一种,仍然等价,对ϵ的描述:
   
+
 
ε(s<-) = {s<-'|P(S->L=s->L|S<-=s<-) = P(S->L=s->L | S<- = s<-'), 对所有s->L∈S->L,s<-'∈S<-, L∈Z+},  (17)
+
<math>
 +
ϵ[\overset{\leftarrow}{S}] \equiv \{\overset{\leftarrow '}{s} \vert P(\overset{\to L}{S} = \overset{\to L}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow}{s}) = P(\overset{\to L}{S} = \overset{\to L}{s} \vert \overset{\leftarrow}{S} = \overset{\leftarrow '}{s}), \overset{\to L}{s} \in \overset{\to L}{S},\overset{\leftarrow '}{s} \in \overset{\leftarrow}{S}, L \in \mathbb{Z}^+   \} \tag{17}
 +
</math>
    
使用这个我们可以构建初始的定义,等式【16】,将所有在每个新划分的历史空间S<-划分成序列就更加直观了。使用L+1导出,是对使用L导出的细化。在最粗糙的级别上,最前面的划分(L = 1)组成了那些历史,对于每一个下个观测有相同分布。这些类就使用下两个观测值的分布做细分,然后是下三个,四个,以此类推。这些划分序列的极限——到那个点,点里每个类中的每个成员都有着对未来相同分布,不管长度如何,同那个类中的每个其它成员一样——是由∼ε导出的S<-的划分。参阅附录B以获取更详细的讨论并查看∼ε的等价关系。
 
使用这个我们可以构建初始的定义,等式【16】,将所有在每个新划分的历史空间S<-划分成序列就更加直观了。使用L+1导出,是对使用L导出的细化。在最粗糙的级别上,最前面的划分(L = 1)组成了那些历史,对于每一个下个观测有相同分布。这些类就使用下两个观测值的分布做细分,然后是下三个,四个,以此类推。这些划分序列的极限——到那个点,点里每个类中的每个成员都有着对未来相同分布,不管长度如何,同那个类中的每个其它成员一样——是由∼ε导出的S<-的划分。参阅附录B以获取更详细的讨论并查看∼ε的等价关系。
470

个编辑