更改

跳到导航 跳到搜索
添加50字节 、 2024年10月15日 (星期二)
第122行: 第122行:  
[[文件:层次机器示意图1.jpg|居中|无框|600x600像素|WU]]
 
[[文件:层次机器示意图1.jpg|居中|无框|600x600像素|WU]]
   −
上表为因果时间序列建模层级,展示了可能的前四个层级,但这个过程是开放式的,可以不止四个层级,每个层级根据其模型类别定义。模型本身由状态(圆圈或方块)和转移(标记箭头)组成,每个模型都有一个独特的起始状态,由一个内嵌的圆圈表示。数据流本身是最低层级,通过将序列测量分组为重复子序列,从数据流中构建出深度为的树。下一个层级的模型,即具有状态和转移的有限自动机(FA),通过将树节点分组从树中重构。所示的最后一个层级,字符串生成机器(PM),通过将FA状态分组并推断出操控寄存器中字符串的生成规则来构建。
+
上表为因果时间序列建模层级,展示了可能的前四个层级,但这个过程是开放式的,可以不止四个层级,每个层级根据其模型类别定义。模型本身由状态(圆圈或方块)和转移(标记箭头)组成,每个模型都有一个独特的起始状态,由一个内嵌的圆圈表示。数据流本身是最低层级,通过将序列测量分组为重复子序列,从数据流中构建出深度为的树。下一个层级的模型,即具有状态和转移的有限自动机(Finite Automaton,简称FA),通过将树节点分组从树中重构。所示的最后一个层级,字符串生成机器(Pattern Matching,简称PM),通过将FA状态分组并推断出操控寄存器中字符串的生成规则来构建。
    
考虑一个由<math>m</math>个测量结果构成的数据流<math>s</math>,如果它是周期性的,那么第0级(Level 0),即测量结果本身,它的表示方法依赖于<math>m</math>。在极限<math>m\to\infty </math>情况下,第0级会产生一个无穷大的表示。当然,第0级是最准确的数据模型,尽管它几乎没有任何帮助,几乎不值得被称为“模型”。相比之下,一个深度为<math>D</math>的树将给出一个有限表示,即使数据流的长度是无限的,只要数据流具有周期小于等于<math>D</math>。这个树有长度为<math>D</math>的路径,由数据流的周期给出。这些路径中的每一个都对应于<math>s</math>中重复模式的一个不同阶段。如果<math>s</math>是非周期性的,那么树模型类将不再是有限的,并且与<math>m</math>无关。 事实上,如果数据流具有正熵(<math>h_μ>0 </math>),那么树的大小将呈指数增长,<math>\approx\left\|\mathcal{A}\right\|^{Dh_{\mu}} </math> ,因为<math>D</math>的增加解释了<math>s</math> 中长度<math>D</math>不断增加的子序列。粗略地说,如果数据流具有随时间衰减得足够快的相关性,则下一级(随机)有限自动机将给出有限表示。状态数<math>\left\|\mathrm{V}\right\| </math>表示数据流中的内存量,因此表示<math>s</math>中测量值之间存在相关性的典型时间。但也有可能第 2 级不提供有限表示。那么就需要另一个级别(第 3 级)。
 
考虑一个由<math>m</math>个测量结果构成的数据流<math>s</math>,如果它是周期性的,那么第0级(Level 0),即测量结果本身,它的表示方法依赖于<math>m</math>。在极限<math>m\to\infty </math>情况下,第0级会产生一个无穷大的表示。当然,第0级是最准确的数据模型,尽管它几乎没有任何帮助,几乎不值得被称为“模型”。相比之下,一个深度为<math>D</math>的树将给出一个有限表示,即使数据流的长度是无限的,只要数据流具有周期小于等于<math>D</math>。这个树有长度为<math>D</math>的路径,由数据流的周期给出。这些路径中的每一个都对应于<math>s</math>中重复模式的一个不同阶段。如果<math>s</math>是非周期性的,那么树模型类将不再是有限的,并且与<math>m</math>无关。 事实上,如果数据流具有正熵(<math>h_μ>0 </math>),那么树的大小将呈指数增长,<math>\approx\left\|\mathcal{A}\right\|^{Dh_{\mu}} </math> ,因为<math>D</math>的增加解释了<math>s</math> 中长度<math>D</math>不断增加的子序列。粗略地说,如果数据流具有随时间衰减得足够快的相关性,则下一级(随机)有限自动机将给出有限表示。状态数<math>\left\|\mathrm{V}\right\| </math>表示数据流中的内存量,因此表示<math>s</math>中测量值之间存在相关性的典型时间。但也有可能第 2 级不提供有限表示。那么就需要另一个级别(第 3 级)。
276

个编辑

导航菜单