更改

跳到导航 跳到搜索
添加9,173字节 、 2024年7月6日 (星期六)
正文翻译完成,开始附录部分
第829行: 第829行:     
备注3。由应用定理2和引理8,我们可以从表示<math>H[S] - h[\overset{\to}{S} \vert \hat{\mathcal{R}}] \le H[\hat{\mathcal{R}}]</math>定理出发。这个具有良好的对称表现形式,但确实是一个更弱的极限,无论是在斑图的长度上,相等地,或是在控制可努力修正因果态(或他竞争者当中的一个)的数量。
 
备注3。由应用定理2和引理8,我们可以从表示<math>H[S] - h[\overset{\to}{S} \vert \hat{\mathcal{R}}] \le H[\hat{\mathcal{R}}]</math>定理出发。这个具有良好的对称表现形式,但确实是一个更弱的极限,无论是在斑图的长度上,相等地,或是在控制可努力修正因果态(或他竞争者当中的一个)的数量。
 +
 +
== 结论备注 ==
 +
 +
=== 讨论 ===
 +
让我们审阅,非正式地,我们展现了什么。我们开始于斑图的自然和斑图发现的问题。我们在这些问题上的考察引导我们期待一种方式去描述斑图且至少是代数的,可计算的,固定随机性的,和因果的。我们在系统上定义了斑图,以一种非常通用和抽象的手法,作为历史的等价类,或隐状态的集合,用于预测。我们定义这些斑图的强度(由他们的广播能力和精确度)和他们的统计复杂度(由状态熵或关于历史的进程保留的信息量)。我们展现了从每个给定全部过去的预测能力的部分进度中获取的这些斑图有多强存在极限。以这种方式,我们窄化我们的目标以找到一个最大强度和最小复杂度的预测器。
 +
 +
最优化预测让我们导向等价关系~ϵ和函数ϵ,以及由因果态和他们的转移来表征斑图——这个ϵ机器。我们第一个定理展现了因果态是最大预测的;我们第二定理,他们是最强表征斑图的最简方式;我们第三定理,他们是唯一拥有双重优势的。后期结果展现了ϵ机器是捕获过程最大强度斑图和强调运用但隐式状态的最小随机方式,相比那些粗略的观察者,比如序列块。
 +
 +
为什么ϵ机制存在状态因果?首先,ϵ机制的结构(或者说,由它的半群代数给出)勾画出变体P(S->|S<-)之间的依赖关系,将每一个新符号决定着接下来的变体考虑成事件。因此,如果状态B跟着状态A那么A是B的原因且B是A的效应。第二,ϵ机制最简保证没有其他事件干扰从A到B渲染的无关性。
 +
 +
ϵ机制因此是过程所有斑图的一个因果表征。它是最大预测且最小复杂度。它是即时计算的,自从它展示过程如何存储信息(在因果态中)并且转换信息(在状态到状态的转移),并且代数(详情请参阅附录D)。它可以从给定的分布和经验数据系统性的方法中被解析计算。它满足在第Ⅱ节F中列出的基本约束。
 +
 +
这些备注表明计算力学和ϵ机制是关联的或对一些领域或许有兴趣。时间序列分析,决策理论,机器学习,和统一代码理论显式的或隐式的要求观测过程的模型。随机过程理论,形式语言和计算,和物理复杂的测量是所有为过程表征所关注的——关注哪些在现代形式的计算设备的设计中浮现的。这些领域的动机经常从计算力学中删除过多。但是它是有用的,如果仅仅通过对比的方式,去简要的接触这些领域并强调单个或多个和计算力学的连接,我们在附录G中去尝试。
 +
 +
=== 当前结果的限制 ===
 +
 +
让我们给一开始制定的和后来在开发中使用的限制假设编制目录。
 +
 +
1.  我们已知在一个过程的所有长度序列块之上的联合分布的精确值。
 +
 +
2.  观测的过程获取的为离散值。
 +
 +
3.  过程在时间上是离散的。
 +
 +
4.  过程是纯粹的时间序列;例如,没有空间扩展。
 +
 +
5. 被观测的过程是统计的。
 +
 +
6. 预测只能基于过程的过去,不能是其他外部的信息源。
 +
 +
问题就产生了,可以在不带来更多麻烦的同时,任何一条有放松的可能吗?
 +
 +
一种方式是提起第一个限制,而去发展统计误差理论,对应于ϵ机制推理指出的,也就是说,需要获得在带有一定数量的因果态的ϵ机制中的多少数据以得到指定水平的置信度。这个程序正在进行并且,给定他的初始过程,我们可以在下一节描述若干课题的更多细节。
 +
 +
第二个限制或许可以被解决掉,但是带有对应地增长数学的长足进步。我们使用过的信息论量化也在连续的随机变量上有定义。他就象许多贮存到连续设置中的结果一样。
 +
 +
第三个限制看起来也容易解决,自从连续时间随机过程理论是适度地良好发展的。这个或许包含熟练的概率理论或功能分析。
 +
 +
作为第四个限制,已经存在有一些技巧能将空间上扩展的系统视为时间序列。必要的,一些看起来所有的通往时空的路径,对待彼此如同它是时间序列。同时这些对于数据压缩工作良好,对于是否全部符合捕获结构它不是特别清晰【84】。在这些课题上有更多的工作需要去做。
 +
 +
在此刻仍不清晰的是怎么去放宽统计假设。有一个不会带来太多麻烦的可形式扩展在这篇文章中大多数结果为非统计过程的方法。它就是,尽管,这些扩展本质上内容有多不清晰,在任何情况下,一个非统计过程系统的聚类是(最好)在它的婴幼儿阶段。
 +
 +
最后,某人会说最后的限制是正向的特征当它倾向于考虑斑图和过程的内生结构。“斑图”是个含糊其辞的词汇,当然,但在平常的使用中它是唯一误以为在过程中包含事物,而不是宇宙的其余部分。给定两个文档的挎贝,其中一份挎贝的内容可以由对照着另一份挎贝被令人羡慕的准确度所预测。这告诉我们他们共享通用的结构,但是没有告知任何关于斑图是什么的内容。自从它确实只是良好地书写并紧密地辩论的科学文章(哪个很可能是高度组织化的)作为它是键盘前的猴子般胡言乱语的片段(哪个确实不是)。
 +
 +
=== 结论和将来工作的方向 ===
 +
 +
计算力学聚焦于理解斑图的自然和斑图发现。我们期待前述发展能确信读者我们即不过敏于当我们说我们已经为这些项目奠定了基础,也不于我们轻率,当我们说这些ϵ机制所表征的斑图和那些我们发现的它们由ϵ机制所重构。我们希望由标注我们的两个对未来工作是广泛林荫大道来结尾。
 +
 +
首先,考虑ϵ机制它们自己的数学。我们刚提到以提出在发展中做出的假设的形式做可能的扩展,但有许多其他方式值得尝试。一定数量的测量理论课题关联到因果态的定义(这里为了简洁而忽略)值得细心处理,沿着参考文献【10】的字里行间。理解好ϵ机制对于连续状态过程测量分辨率缩放属性,以及他们和Krohn-Rhodes分解自动理论【30】的关系,将很有帮助。谁经营着吸收参考文献【26】第二卷或许可能处于回答关于过程持有的,或许甚至给予ϵ机制纯关系理论叙述结构的有趣问题位置。我们已经在许多地方婉转提到预测性和复杂性之间的此消彼涨的关系。对于给定的过程,这里大概有一系列最优机器连接于单个状态,零复杂度机器,对ϵ机器带有最小预测性。路径的每个成员对一定度数的预测性而言是最小机器;知道什么,或者任何我们通常可以说的事情,是有于这个“预测前沿”的外形,将可能非常有趣。
 +
 +
其次,这里有ϵ机器的重构,一个关于哪个是我们说过无关的行动。曾经我们在上面(12页)提到过,已经有若干从数据重构机器的算法,甚至有“实时”版本。很明显这些算法将在无限时间和无限数据的限制中找到正确的机器。需要的是理解这些过程制造的各种失误的不同重构过程的误差统计【85】。理想状态下,我们希望找到对应于重构产物的“信任区域”。目标是计算(i)对于给定体积数据的不同重构误差的度数概率,(ii)需要确信一个在误差之上的修理边界数据的数量,又或者(iii)集中于ϵ机器在不同的重构过程的速率。目前为止,一个解析理论已经发展成预测估计的因果态的平均数量,作为当重构特定类型的过程使用的一定数量数据的函数【86】。一旦我们支配一个对于ϵ机器更完整的统计推理理论,类似地什么已经存在于计机学习理论也有可能,我们将处于开始分析的位置,显著地和严格地,自然世界展现的众多引人入胜的斑图和信息处理结构。
 +
 +
== 申明 ==
 +
 +
我们感谢Dave Albers,Dave Feldman,Jon Fetter,Rob Haslinger,Wim Hordijk,Amihan Huesmann,Cris Moore,Mitch Porter,Erik van Nimwegen,和Karl Young在脚本上的建议;1998圣塔菲复杂系统暑期学校成员,麦迪逊概率研究会,麦迪逊物理系毕业学生迷你学术研讨会,和安娜堡复杂系统研讨会在这些结果的早期版本中提供了大量有帮助的建议。这个工作由圣塔菲研究所通过ONR授权N00014-95-1-0975,NSF授权PHY-9970158,和DARPA合同F30602-00-2-0583在计算、动态、和推理程序提供支持。
 +
 +
== 附录 ==
 +
 +
=== 信息论公式 ===
 +
下面的公式证明在开发中很有用。他们是相对直观的,给我们解释性,并且他们可以用比单纯代数多一点的东西去证明;参阅文献【62】。下面,f是一个函数。
 +
 +
等式(A1)和(A6)被称作熵的链式法则。严格来说,等式(A12)右手边应该读作“对每个<math>y, P(X = x \vert Y = y) > 0</math>对一个,仅一个x”。
470

个编辑

导航菜单