考虑一个由<math>m</math>个测量结果构成的数据流<math>s</math>,如果它是周期性的,那么第0级(Level 0),即测量结果本身,它的表示方法依赖于<math>m</math>。在极限<math>m\to\infty </math>情况下,第0级会产生一个无穷大的表示。当然,第0级是最准确的数据模型,尽管它几乎没有任何帮助,几乎不值得被称为“模型”。相比之下,一个深度为<math>D</math>的树将给出一个有限表示,即使数据流的长度是无限的,只要数据流具有周期小于等于<math>D</math>。这个树有长度为<math>D</math>的路径,由数据流的周期给出。这些路径中的每一个都对应于<math>s</math>中重复模式的一个不同阶段。如果<math>s</math>是非周期性的,那么树模型类将不再是有限的,并且与<math>m</math>无关。 事实上,如果数据流具有正熵(<math>h_μ>0 </math>),那么树的大小将呈指数增长,<math>\approx\left\|\mathcal{A}\right\|^{Dh_{\mu}} </math> ,因为<math>D</math>的增加解释了<math>s</math> 中长度<math>D</math>不断增加的子序列。粗略地说,如果数据流具有随时间衰减得足够快的相关性,则下一级(随机)有限自动机将给出有限表示。状态数<math>\left\|\mathrm{V}\right\| </math>表示数据流中的内存量,因此表示<math>s</math>中测量值之间存在相关性的典型时间。但也有可能第 2 级不提供有限表示。那么就需要另一个级别(第 3 级)。 | 考虑一个由<math>m</math>个测量结果构成的数据流<math>s</math>,如果它是周期性的,那么第0级(Level 0),即测量结果本身,它的表示方法依赖于<math>m</math>。在极限<math>m\to\infty </math>情况下,第0级会产生一个无穷大的表示。当然,第0级是最准确的数据模型,尽管它几乎没有任何帮助,几乎不值得被称为“模型”。相比之下,一个深度为<math>D</math>的树将给出一个有限表示,即使数据流的长度是无限的,只要数据流具有周期小于等于<math>D</math>。这个树有长度为<math>D</math>的路径,由数据流的周期给出。这些路径中的每一个都对应于<math>s</math>中重复模式的一个不同阶段。如果<math>s</math>是非周期性的,那么树模型类将不再是有限的,并且与<math>m</math>无关。 事实上,如果数据流具有正熵(<math>h_μ>0 </math>),那么树的大小将呈指数增长,<math>\approx\left\|\mathcal{A}\right\|^{Dh_{\mu}} </math> ,因为<math>D</math>的增加解释了<math>s</math> 中长度<math>D</math>不断增加的子序列。粗略地说,如果数据流具有随时间衰减得足够快的相关性,则下一级(随机)有限自动机将给出有限表示。状态数<math>\left\|\mathrm{V}\right\| </math>表示数据流中的内存量,因此表示<math>s</math>中测量值之间存在相关性的典型时间。但也有可能第 2 级不提供有限表示。那么就需要另一个级别(第 3 级)。 |