对于集合<math> \overset{\leftarrow}{S}</math>的划分可以有很多种,若某一种划分能够在预测能力最强的同时又非常简洁,那么它肯定是最优的划分,我们把这种用最优的划分方法得到的状态称为[[因果态]]。因果态就是智能体对测量结果进行处理后,根据其内部模型(尤其是状态结构)识别出的斑图,并且这种斑图不随时间发生变化。形式化定义为:对于任意的时刻<math>t </math> 和<math>t^{'} </math>,给定过去状态<math> \overleftarrow{s_t} </math>的条件下,未来状态<math> \overrightarrow{s} </math>的分布与给定过去状态<math> \overleftarrow{s_{t^{'}}} </math>的条件下,未来状态<math> \overrightarrow{s} </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t\sim t^{'} </math>,“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系,也叫预测等价性(predictive equivalence),可以用公式表示为:<math>t\sim t^{'} \triangleq Pr(\overrightarrow{s}|\overleftarrow{s_t} )=Pr(\overrightarrow{s} |\overleftarrow{s_{t^{'}}} ) </math>,若<math>t </math> 和<math>t^{'} </math>对未来状态预测的分布相同,则定义他们具有相同的因果态(casual state)。 | 对于集合<math> \overset{\leftarrow}{S}</math>的划分可以有很多种,若某一种划分能够在预测能力最强的同时又非常简洁,那么它肯定是最优的划分,我们把这种用最优的划分方法得到的状态称为[[因果态]]。因果态就是智能体对测量结果进行处理后,根据其内部模型(尤其是状态结构)识别出的斑图,并且这种斑图不随时间发生变化。形式化定义为:对于任意的时刻<math>t </math> 和<math>t^{'} </math>,给定过去状态<math> \overleftarrow{s_t} </math>的条件下,未来状态<math> \overrightarrow{s} </math>的分布与给定过去状态<math> \overleftarrow{s_{t^{'}}} </math>的条件下,未来状态<math> \overrightarrow{s} </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t\sim t^{'} </math>,“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系,也叫预测等价性(predictive equivalence),可以用公式表示为:<math>t\sim t^{'} \triangleq Pr(\overrightarrow{s}|\overleftarrow{s_t} )=Pr(\overrightarrow{s} |\overleftarrow{s_{t^{'}}} ) </math>,若<math>t </math> 和<math>t^{'} </math>对未来状态预测的分布相同,则定义他们具有相同的因果态(casual state)。 |