更改

添加2,033字节 、 2024年6月19日 (星期三)
整理到公式41,大部分使用<math></math>标记标出
第508行: 第508行:  
现在,P(S = ρ|S<- = s<-) = 0, 直到ρ = ϵ(s<-), 在这种情况P(S = ρ| S<- = s<-) = 1. 每种情况,在等式(21)最后一行前面两个因子可以写成等式(18),
 
现在,P(S = ρ|S<- = s<-) = 0, 直到ρ = ϵ(s<-), 在这种情况P(S = ρ| S<- = s<-) = 1. 每种情况,在等式(21)最后一行前面两个因子可以写成等式(18),
   −
P(S->=s->|S=ρ, S<-=s<-)P(S=ρ|S<-=s<-)
+
<math>
=P(S->=s->|S=ρ)P(S=ρ|S<-=s<-), (22)
+
P(\overset{\to}{S}=\overset{\to}{s} \vert S = σ, \overset{\leftarrow}{S}=\overset{\leftarrow}{s})P(S = σ \vert \overset{\leftarrow}{S}=\overset{\leftarrow}{s}) \tag{22} \\
 +
= P(\overset{\to}{S}=\overset{\to}{s} \vert S = σ)P(S = σ \vert \overset{\leftarrow}{S}=\overset{\leftarrow}{s}) ,  
 +
</math>
    
因此,将等式(22)替换回等式(21),
 
因此,将等式(22)替换回等式(21),
   −
P(S<-=s<-, S=ρ, S->=s->)
+
<math>
    =P(S->=s->|S = ρ)P(S = ρ| S<- = s<-) P(S<- = s<-). (23)
+
P(\overset{\leftarrow}{S}=\overset{\leftarrow}{s}, S = σ, \overset{\to}{S}=\overset{\to}{s}) \tag{23} \\
 +
= P(\overset{\to}{S}=\overset{\to}{s} \vert S = σ)P(S = σ \vert \overset{\leftarrow}{S}=\overset{\leftarrow}{s})P(\overset{\leftarrow}{S}=\overset{\leftarrow}{s}) .
 +
</math>
    
证毕。
 
证毕。
第536行: 第540行:  
    在任意给定时间的因果态和观测过程的下一个值共同决定新的因果态;这点在引理5中做了简短证明。因此,一段因果态继任者有自然联系。回忆第二节E部分关于原因的讨论。更多地,给定当前因果态,所有可能的下一个值已经定好定义了条件分布。实际上,由构建可知全部准无限未来也如此。因此,有良好定义的过程的分布Tij(s)生成的值s∈A并转换到因果态Sj,如果它在Si状态中。
 
    在任意给定时间的因果态和观测过程的下一个值共同决定新的因果态;这点在引理5中做了简短证明。因此,一段因果态继任者有自然联系。回忆第二节E部分关于原因的讨论。更多地,给定当前因果态,所有可能的下一个值已经定好定义了条件分布。实际上,由构建可知全部准无限未来也如此。因此,有良好定义的过程的分布Tij(s)生成的值s∈A并转换到因果态Sj,如果它在Si状态中。
   −
定义8(因果转换)已经标记的转换概率Tij(s)是促成状态Si到Sj转换的概率,并发出符号s∈A:
+
定义8(因果转换)已经标记的转换概率<math>T_{ij}^{(s)}</math>是促成状态S<sub>i</sub>到S<sub>j</sub>转换的概率,并发出符号s∈A:
   −
Tij(s) \equiv P(S' = Sj, S->1 = s|S = Si),(24)
+
<math>
 +
T_{ij}^{(s)} \equiv P(S'=S_{j}, \overset{\to 1}{S}=s \vert S = S_i), \tag{24}
 +
</math>
   −
其中S是当前因果态,并且S'是它发出s的继任者。我们用T表示集合{Tij(s) : s∈A}。
+
其中S是当前因果态,并且S'是它发出s的继任者。我们用T表示集合<math>{T_{ij}^{(s)} : s \in A}</math>
   −
引理4(转移概率)Tij(s)由下式给出
+
引理4(转移概率)<math>{T_{ij}^{(s)}</math>由下式给出
   −
Tij(s) = P(S<s∈Sj|s<-∈Si) (25)
+
<math>
    = P(s<-∈Si, s<-s∈Sj)/P(s<-∈Si),(26)
+
\begin{aligned}
 +
T_{ij}^{(s)} & = P(\overset{\leftarrow}{s}s \in S_{j} \vert \overset{\leftarrow}{s} \in S_{i}) (25) \\
 +
& = \frac{P(\overset{\leftarrow}{s} \in S_{i}, \overset{\leftarrow}{s}s \in S_{j})}{P(\overset{\leftarrow}{s} \in S_{i})} , \  (26)
 +
\end{aligned}
 +
</math>
 
其中s<-s读作准无限序列,由在s<-的末尾连接s∈A获得。
 
其中s<-s读作准无限序列,由在s<-的末尾连接s∈A获得。
    
    证明。
 
    证明。
    Tij(s) = P(S' = Sj, S->1 = s|S = Si) (27)
+
<math>
    = P(S' = Sj, S->1 = s, S = Si) / P(S = Si). (28)
+
\begin{aligned}
      
+
T_{ij}^{(s)} & = P(S'=S_{j}, \overset{\to 1}{S}=s \vert S = S_i) (27) \\
 +
& = \frac{P(S'=S_{j}, \overset{\to 1}{S}=s, S = S_i)}{P(S = S_i )}. (28)  
 +
\end{aligned}
 +
</math>
 +
 
 
现在 S = Si当有仅当 s<-∈Si, 并且 S' = Sj当且仅当s<-'∈Sj,其中s<-'我们表示紧随s<-其后的历史;为了统一,s<-' = s<-s。所以我们可以重写等式(28)如
 
现在 S = Si当有仅当 s<-∈Si, 并且 S' = Sj当且仅当s<-'∈Sj,其中s<-'我们表示紧随s<-其后的历史;为了统一,s<-' = s<-s。所以我们可以重写等式(28)如
   −
Tij(s) = P(S<-∈Si,S->1 = s, s<-'∈Sj) / P(S = Si) (29)
+
<math>
    = P(s<-∈Si, S->1 = s, s<-s∈Sj) / P(S = Si) (30)
+
\begin{aligned}
    = P(s<-∈Si, s<-s∈Sj) / P(S = Si). (31)
+
T_{ij}^{(s)} & = \frac{P(\overset{\leftarrow}{s} \in S_i, \overset{\to 1}{S}=s, \overset{\leftarrow '}{s} \in S_j)}{P(S = S_i)} \  (29) \\
   
+
& = \frac{P(\overset{\leftarrow}{s} \in S_i, \overset{\to 1}{S}=s, \overset{\leftarrow}{s}s \in S_j)}{P(S = S_i)} \  (30) \\
 +
& = \frac{P(\overset{\leftarrow}{s} \in S_i, \overset{\leftarrow}{s}s \in S_j)}{P(S = S_i)}. (31)  
 +
\end{aligned}
 +
</math>
 +
 
 
在第三行我们使用S<-=s<-和S<-'=s<-s的事实联合表明S->1 = s,使得条件相同。证毕。
 
在第三行我们使用S<-=s<-和S<-'=s<-s的事实联合表明S->1 = s,使得条件相同。证毕。
   第585行: 第603行:     
    假设这点不对。就有存在至少一个将来的s->符合
 
    假设这点不对。就有存在至少一个将来的s->符合
   
+
 
P(S-> = s-> |  S<- = s<-s) != P(S-> = s-> | S-> = s-> | S<- = s<-'s),(32)
+
<math>
 +
P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S}=\overset{\leftarrow}{s}s) \not = P(\overset{\to}{S} = \overset{\to}{s} \vert \overset{\leftarrow}{S}=\overset{\leftarrow '}{s}s) \tag{32}
 +
</math>
    
尽管ϵ(s<-) = ϵ(s<-')。等价地,我们应该有
 
尽管ϵ(s<-) = ϵ(s<-')。等价地,我们应该有
   −
P(S<-> = s<-ss->)/P(S<- = s<-s) != P(S<-> = S<-'ss->)/P(S<- = s<-'s),(33)
+
<math>
 +
\frac{P(\overset{\leftrightarrow}{S} = \overset{\leftarrow}{s}s\overset{\to}{s})} {P( \overset{\leftarrow}{S}=\overset{\leftarrow}{s}s)} \not = \frac{P(\overset{\leftrightarrow}{S} = \overset{\leftarrow '}{s}s\overset{\to}{s})}{P( \overset{\leftarrow}{S}=\overset{\leftarrow '}{s}s)} \tag{33}
 +
</math>
    
其中我们将ss->读为准无限字符串,开始于s而由s->继续。(记住,我们打破随机过程的点从一个过去到一个未来是武断的。)尽管如此,在分母里的概率是等于P(S->1 = s | S<- = s<-P(S<- = s<-)和P(S->1 = s | S<- = s<-')P(S<- = s<-'),分别地,而且由假设P(S->1 = s | S<- = s<-') = P(S->1 = s | S<- = s<-),由于ϵ(s<-') = ϵ(s<-)。因此,我们应该需要
 
其中我们将ss->读为准无限字符串,开始于s而由s->继续。(记住,我们打破随机过程的点从一个过去到一个未来是武断的。)尽管如此,在分母里的概率是等于P(S->1 = s | S<- = s<-P(S<- = s<-)和P(S->1 = s | S<- = s<-')P(S<- = s<-'),分别地,而且由假设P(S->1 = s | S<- = s<-') = P(S->1 = s | S<- = s<-),由于ϵ(s<-') = ϵ(s<-)。因此,我们应该需要
   −
P(S<-> = s<-ss->)/P(S<- = s<-) != P(S<-> = s<-'ss->)/P(S<- = s<-')。(34)
+
<math>
 +
\frac{P(\overset{\leftrightarrow}{S} = \overset{\leftarrow}{s}s\overset{\to}{s})} {P( \overset{\leftarrow}{S}=\overset{\leftarrow}{s})} \not = \frac{P(\overset{\leftrightarrow}{S} = \overset{\leftarrow '}{s}s\overset{\to}{s})}{P( \overset{\leftarrow}{S}=\overset{\leftarrow '}{s})} \tag{34}
 +
</math>
    
这也是一样的,然后,因为
 
这也是一样的,然后,因为
   −
P(S-> = ss->|S<- = s<-) != P(S-> = ss-> | S<- = s<-')。(35)
+
<math>
 +
P(\overset{\to}{S} = s\overset{\to}{s} \vert \overset{\leftarrow}{S}=\overset{\leftarrow}{s}) \not = P(\overset{\to}{S} = s\overset{\to}{s} \vert \overset{\leftarrow}{S}=\overset{\leftarrow '}{s}). \tag{35}
 +
</math>
    
这也是在说有一个未来ss->有不同的概率依赖于我们是用s<-还是s<-'的条件。但是这个对立面假设这两段历史附属于相同的因果态。因此,没有这样的未来s->,而引理替换的描述是真的。证毕。
 
这也是在说有一个未来ss->有不同的概率依赖于我们是用s<-还是s<-'的条件。但是这个对立面假设这两段历史附属于相同的因果态。因此,没有这样的未来s->,而引理替换的描述是真的。证毕。
    
    备注1。在自动化理论【66】中,一个状态的集合和转换说是决定性的,如果当前的状态和下一个输入——在这里,是原始随机过程的下一个结果——一并修正下一个状态。这个用语“决定性”通常容易混淆,因为很多随机过程(例如,简单的马尔可夫链)在这种语境下是决定性的。
 
    备注1。在自动化理论【66】中,一个状态的集合和转换说是决定性的,如果当前的状态和下一个输入——在这里,是原始随机过程的下一个结果——一并修正下一个状态。这个用语“决定性”通常容易混淆,因为很多随机过程(例如,简单的马尔可夫链)在这种语境下是决定性的。
   
+
 
    备注2。从固定状态开始,一个给定的符号总是导向最多一个单状态,但这会有多个从一个状态到另一个的转换,每一个被标记会不同的符号。
+
备注2。从固定状态开始,一个给定的符号总是导向最多一个单状态,但这会有多个从一个状态到另一个的转换,每一个被标记会不同的符号。
   
+
 
    备注3。很清楚的是,如果Tij(s) >0,那么Tij(s) = P(S->1 = s|S = Si)。在自动化理论里这个“不允许”转换(Tij(s) = 0)有时候是明显存在的,并且导向一个“弹出”状态指示对应部分历史没有发生。
+
备注3。很清楚的是,如果Tij(s) >0,那么Tij(s) = P(S->1 = s|S = Si)。在自动化理论里这个“不允许”转换(Tij(s) = 0)有时候是明显存在的,并且导向一个“弹出”状态指示对应部分历史没有发生。
   
+
 
 
引理6(因果态是相互不依赖的)因果态上的概率分布在不同时间是条件无关的。
 
引理6(因果态是相互不依赖的)因果态上的概率分布在不同时间是条件无关的。
    
    证明。我们想展示的是,将因果态序列在三个连续的时间步写成S, S',S\'\',在给定S'后,S和S\'\'是条件无关的。我们可以直接做到这样:
 
    证明。我们想展示的是,将因果态序列在三个连续的时间步写成S, S',S\'\',在给定S'后,S和S\'\'是条件无关的。我们可以直接做到这样:
   
+
 
P(S = σ, S' = σ',S\'\' = σ\'\')
+
<math>
= P(S\'\' = σ\'\' | S = σ, S' = σ')P(S = σ, S' = σ')
+
\begin{aligned}
= P(S->1 ∈ a | S = σ, S' = σ')P(S = σ, S' = σ'), (36)
+
P & (S = σ, S' = σ', S'' = σ'') \ (36) \\
 +
& = P(S'' = σ'' \vert S = σ, S' = σ')P(S = σ, S' = σ') \\
 +
& = P(\overset{\to 1}{S} \in a \vert S = σ, S' = σ')P(S = σ, S' = σ') ,  
 +
\end{aligned}
 +
</math>
    
其中a是所有将σ'导向σ\'\'符号的子集。这是一个良好定义的子集,在引理5的即刻前述的铺垫里,也保证了我们使用过的条件概率相等。类似地,
 
其中a是所有将σ'导向σ\'\'符号的子集。这是一个良好定义的子集,在引理5的即刻前述的铺垫里,也保证了我们使用过的条件概率相等。类似地,
   −
P(S\'\' = σ\'\' | S' = σ') = P(S->1 ∈ a | S' = σ')。(37)
+
<math>
 +
P(S'' = σ'' \vert S' = σ') = P(\overset{\to 1}{S} \in a \vert S' = σ') . \tag{37}
 +
</math>
    
但是,经构造式
 
但是,经构造式
   −
P(S->1 ∈ a | S = σ, S' = σ') = P(S->1 ∈ a | S' = σ'), (38)
+
<math>
 +
P(\overset{\to 1}{S} \in a \vert S = σ, S' = σ') = P(\overset{\to 1}{S} \in a \vert S' = σ') , \tag{38}
 +
</math>
    
并且因此
 
并且因此
   −
P(S'' = σ'' | S' = σ) = P(S'' = σ'' | S = σ, S' = σ')。(39)
+
<math>
 +
P(S'' = σ'' \vert S' = σ') = P(S'' = σ'' \vert S = σ, S' = σ') , \tag{39}
 +
</math>
    
所以,可以继续,
 
所以,可以继续,
   −
P( S = σ, S' = σ', S\'\' = σ\'\')
+
<math>
= P(S\'\' = σ\'\' | S' = σ')P(S = σ, S' = σ')
+
\begin{aligned}
= P(S\'\' = σ\'\' | S' = σ')P(S' = σ' | S = σ)P(S = σ). (40)
+
P & (S = σ, S' = σ', S'' = σ'') \ (40) \\
 +
& = P(S'' = σ'' \vert S' = σ')P(S = σ, S' = σ') \\
 +
& = P(S'' = σ'' \vert S' = σ')P(S' = σ' \vert S = σ) P(S = σ) .  
 +
\end{aligned}
 +
</math>
    
最后一行遵从了概率分布并等价地更容易由表达式给出
 
最后一行遵从了概率分布并等价地更容易由表达式给出
   −
P(S\'\'|S')P(S|S')P(S')。(41)
+
<math>
 +
P(S'' \vert S')P(S \vert S')P(S') \tag{41}
 +
</math>
    
因此,由等式(41)导出后应用数学方法,因果态在不同时间片是独立的,条件是在中间的因果态。证毕。
 
因此,由等式(41)导出后应用数学方法,因果态在不同时间片是独立的,条件是在中间的因果态。证毕。
   −
    备注1。这个引理加强了申明,该申明说因果态是,实际上,因果上有效的状态:给定当前状态的知识,已经过去之前的些,改变不了什么。(再次,回忆下在第II节E中哲学性的预备内容。)
+
备注1。这个引理加强了申明,该申明说因果态是,实际上,因果上有效的状态:给定当前状态的知识,已经过去之前的些,改变不了什么。(再次,回忆下在第II节E中哲学性的预备内容。)
   
+
 
    备注2。这个结果指示出因果态,考虑成一个过程,定义了一个马尔可夫链。因此,因果态可以被大约考虑成马尔可夫状态的生成。我们说“一种”是因为ϵ-机制是基本上更丰富的【5,10】,和通常附加在马尔可夫链上的那些相比。
+
备注2。这个结果指示出因果态,考虑成一个过程,定义了一个马尔可夫链。因此,因果态可以被大约考虑成马尔可夫状态的生成。我们说“一种”是因为ϵ-机制是基本上更丰富的【5,10】,和通常附加在马尔可夫链上的那些相比。
   
+
 
 
定义10(ϵ-机制重构)
 
定义10(ϵ-机制重构)
  
470

个编辑