式中序列<math>t </math>和<math>t^{'} </math>通常是不同的,上式可以理解为,如果<math>t∼t^{'} </math>,就算在不同时刻测量到了不同状态,智能体对未来状态的预测结果也会是相同的。其次,当<math>s_t^← </math>和<math>s_{t^{'}}^← </math>作为特定符号序列考虑时,<math>t </math>和<math>t^{'} </math>可以在许多其他时间点发生。 | 式中序列<math>t </math>和<math>t^{'} </math>通常是不同的,上式可以理解为,如果<math>t∼t^{'} </math>,就算在不同时刻测量到了不同状态,智能体对未来状态的预测结果也会是相同的。其次,当<math>s_t^← </math>和<math>s_{t^{'}}^← </math>作为特定符号序列考虑时,<math>t </math>和<math>t^{'} </math>可以在许多其他时间点发生。 |