更改

删除206字节 、 2024年9月4日 (星期三)
第203行: 第203行:     
<math> Pr(s^→ |s_t^← ) </math>和<math> Pr(s^→ |s_{t^{'}}^← ) </math>为<math> s^→  </math>的条件概率分布,式中序列<math>t </math>和<math>t^{'} </math>通常是不同的,如果生成数据流<math>s </math>的过程是遍历的,上式可以理解为,如果<math>t∼t^{'} </math>,就算在不同时刻测量到了不同状态,智能体对未来状态的预测结果也会是相同的。其次,当<math>s_t^← </math>和<math>s_{t^{'}}^← </math>作为特定符号序列考虑时,<math>t </math>和<math>t^{'} </math>可以在许多其他时间点发生。
 
<math> Pr(s^→ |s_t^← ) </math>和<math> Pr(s^→ |s_{t^{'}}^← ) </math>为<math> s^→  </math>的条件概率分布,式中序列<math>t </math>和<math>t^{'} </math>通常是不同的,如果生成数据流<math>s </math>的过程是遍历的,上式可以理解为,如果<math>t∼t^{'} </math>,就算在不同时刻测量到了不同状态,智能体对未来状态的预测结果也会是相同的。其次,当<math>s_t^← </math>和<math>s_{t^{'}}^← </math>作为特定符号序列考虑时,<math>t </math>和<math>t^{'} </math>可以在许多其他时间点发生。
  −
这为因果态集合'''<math>G </math>'''提供了正式的定义,对于给定的状态''<math>S </math>'' ,可以从中观察到的未来序列的集合'''<math>{g_S^→:S∈G} </math>''' 被称为它的“未来形态”(future morph)。导致状态''<math>S </math>''发生的序列集合被称为它的“过去形态”(past morph)。
      
===因果态的主要性质===
 
===因果态的主要性质===
将所有历史序列的集合记作<math> \overrightarrow{S}</math>,将<math> \overrightarrow{S}</math>按照某种函数映射方法划分为若干个互斥且全面的子集,那么每个子集就是一个有效态(effective state),按照同一个划分方法得到的有效态集合记作<math>[\mathcal{R}] </math>,进一步理解其实有效态就是将<math> \overrightarrow{S}</math>中的某段序列粗粒化后得到的宏观态。不同的划分方式对应不同有效态,因果态就是其中一种特殊的有效态。
+
将所有历史序列的集合记作<math> \overrightarrow{S}</math>,将<math> \overrightarrow{S}</math>按照某种函数映射方法划分为若干个互斥且全面的子集,那么每个子集就是一个有效态(effective state),按照同一个划分方法得到的有效态集合记作<math>\mathcal{R} </math>,进一步理解其实有效态就是将<math> \overrightarrow{S}</math>中的某段序列粗粒化后得到的宏观态。按照不同的划分方法会得到不同的<math>\mathcal{R} </math>,它们的集合记作<math>\hat{\mathcal{R}} </math>。按照最优的划分方法得到的有效态就是因果态,它的集合形式记作<math>\mathcal{S} </math>。
    
(1)因果态在所有有效态中具有最高预测性
 
(1)因果态在所有有效态中具有最高预测性
276

个编辑