更改

跳到导航 跳到搜索
添加6字节 、 2024年9月8日 (星期日)
第136行: 第136行:  
上图为某种划分方法的示意图,将集合<math> \overset{\leftarrow}{S}</math>划分为某类有效态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>,值得注意的是,<math> \mathcal{R}_i</math>不必形成紧致集,也可以是康托集或其他更特殊的结构,上图为了示意清楚才这样画的。
 
上图为某种划分方法的示意图,将集合<math> \overset{\leftarrow}{S}</math>划分为某类有效态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>,值得注意的是,<math> \mathcal{R}_i</math>不必形成紧致集,也可以是康托集或其他更特殊的结构,上图为了示意清楚才这样画的。
   −
用来划分集合<math> \overset{\leftarrow}{S}</math>的映射可以有很多种,若某一种划分方法能够在预测能力最强的同时消耗的计算资源最少,那么它肯定是最优的划分。为了找到这种最优的划分,需要定义因果态的概念,因果态就是智能体对测量结果进行处理后,根据其内部模型(尤其是状态结构)识别出的模式,并且这种模式不随时间发生变化。形式化定义为:对于任意的时间点<math>t </math> 和<math>t^{'} </math>,给定过去状态<math> s_t^←  </math>的条件下,未来状态<math> s^→ </math>的分布与给定过去状态<math> s_{t^{'}}^←  </math>的条件下,未来状态<math> s^→ </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t∼t^{'} </math>,“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系,可以用公式表示为:<math>t∼t^{'} \triangleq Pr(s^→ |s_t^← )=Pr(s^→ |s_{t^{'}}^← ) </math>,若<math>t </math> 和<math>t^{'} </math>对未来状态的分布相同,则定义他们具有相同的因果态(casual state)。
+
用来划分集合<math> \overset{\leftarrow}{S}</math>的映射可以有很多种,若某一种划分方法能够在预测能力最强的同时消耗的计算资源最少,那么它肯定是最优的划分。为了找到这种最优的划分,需要定义因果态的概念,因果态就是智能体对测量结果进行处理后,根据其内部模型(尤其是状态结构)识别出的模式,并且这种模式不随时间发生变化。形式化定义为:对于任意的时间点<math>t </math> 和<math>t^{'} </math>,给定过去状态<math> s_t^←  </math>的条件下,未来状态<math> s^→ </math>的分布与给定过去状态<math> s_{t^{'}}^←  </math>的条件下,未来状态<math> s^→ </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t∼t^{'} </math>,“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系,可以用公式表示为:<math>t∼t^{'} \triangleq Pr(s^→ |s_t^← )=Pr(s^→ |s_{t^{'}}^← ) </math>,若<math>t </math> 和<math>t^{'} </math>对未来状态预测的分布相同,则定义他们具有相同的因果态(casual state)。
 
[[文件:因果态的定义.jpg|居中|无框|400x400px|替代=]]
 
[[文件:因果态的定义.jpg|居中|无框|400x400px|替代=]]
 
如上图所示,在<math>t_9</math>和<math>t_{13}</math>时刻分别对应一个状态,这两个状态处于相同的因果态,因为对未来的预测具有相同的分布;在<math>t_{11}</math>时刻的状态,则与<math>t_9</math>和<math>t_{13}</math>时刻处于不同的因果态。
 
如上图所示,在<math>t_9</math>和<math>t_{13}</math>时刻分别对应一个状态,这两个状态处于相同的因果态,因为对未来的预测具有相同的分布;在<math>t_{11}</math>时刻的状态,则与<math>t_9</math>和<math>t_{13}</math>时刻处于不同的因果态。
269

个编辑

导航菜单