更改

计算力学 (查看源代码)

2024年11月20日 (三) 18:43的版本

添加64字节、周三18:43

第42行：第42行：

===因果态的定义===

−

~~智能体对环境的测量精度一般都是有限的，测量结果只能描述环境状态的投影。若将环境过去未来的所有信息视为限制在离散值、离散时间上的稳定~~[[随机过程]]~~，用双无限序列可数集合~~<math>\overleftrightarrow{S}=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>~~表示，则测量结果为<math>\overleftrightarrow{S}</math>中任意随机变量的序列。基于时间~~<math>t</math>~~可以将~~<math>\overleftrightarrow{S}</math>分为单侧前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和单侧后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} </math>两个部分，所有可能的未来序列<math>s_t^→</math>形成的集合记作<math> \overrightarrow{S}</math>，所有可能的历史序列<math>\overleftarrow{s_t}</math>形成的集合记作<math> \overleftarrow{S}</math>。

+

智能体对环境的测量精度一般都是有限的，测量结果只能描述环境状态的投影。我们可以将环境从过去到未来的变化用一个离散的稳定[[随机过程]]描述，状态的取值空间则为双无限序列可数集合<math>\overleftrightarrow{S}=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>，也就是说，一个状态指的是一个时间序列。基于当前的时刻<math>t</math>，我们可以将<math>\overleftrightarrow{S}</math>分为单侧前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和单侧后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} </math>两个部分，所有可能的未来序列<math>s_t^→</math>形成的集合记作<math> \overrightarrow{S}</math>，所有可能的历史序列<math>\overleftarrow{s_t}</math>形成的集合记作<math> \overleftarrow{S}</math>。某一个时刻的状态指的是截止到当前时刻的历史序列。

−

~~按照一定的划分方法（ partition）将~~<math> \~~overset~~{\~~leftarrow}~~{S}~~</math>全部划分为若干个互斥的子集，那么每个子集就是一个状态，这些划分得到的状态的集合记作<math>~~\mathcal{R} </math>~~，划分方法对应的函数映射~~<math> ~~η </math>用公式表示为<math> \eta{:}\overleftarrow{S}\mapsto~~\mathcal{R}</math>~~，也可以将划分得到的状态理解为将~~<math> \overset{\leftarrow}{S}</math>~~中的某段序列[[马尔科夫链的粗粒化|粗粒化]]后得到的宏观态。~~

+

通过某种划分（ partition），我们可以找到观测到的状态（可以称之为微观态）与智能体压缩后得到的隐空间上的状态（可以称为宏观态）之间的对应关系。划分为一种映射，<math> \eta{:}\overleftarrow{S}\mapsto\mathcal{R}</math>，其中<math>\mathcal{R} </math>是微观状态空间的子集的集合，要满足其元素彼此互斥，而且所有元素的并集等于<math> \overset{\leftarrow}{S}</math>。通过划分操作得到的每个子集都可以被视为对应着一个宏观态。

[[文件:划分示意图.jpg|居中|400x400像素|替代=|无框]]

−

~~上图为某种划分方法的示意图，将集合~~<math> \overset{\leftarrow}{S}</math>划分为某类状态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>，值得注意的是，<math> \mathcal{R}_i</math>不必形成紧致集，也可以是康托集或其他更特殊的结构，上图为了示意清楚才这样画的。

+

上图为某种划分的示意图，将集合<math> \overset{\leftarrow}{S}</math>划分为某类状态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>，值得注意的是，<math> \mathcal{R}_i</math>不必形成紧致集，也可以是康托集或其他更特殊的结构，上图为了示意清楚才这样画的。

−

用来划分集合<math> \overset{\leftarrow}{S}</math>的映射可以有很多种，若某一种划分方法（ partition）能够在预测能力最强的同时消耗的计算资源最少，那么它肯定是最优的划分，我们把这种用最优的划分方法得到的状态称为因果态。因果态就是智能体对测量结果进行处理后，根据其内部模型（尤其是状态结构）识别出的斑图，并且这种斑图不随时间发生变化。形式化定义为：对于任意的时刻<math>t </math> 和<math>t^{'} </math>，给定过去状态<math> s_t^← </math>的条件下，未来状态<math> s^→ </math>的分布与给定过去状态<math> s_{t^{'}}^← </math>的条件下，未来状态<math> s^→ </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t∼t^{'} </math>，“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系，可以用公式表示为：<math>t∼t^{'} \triangleq Pr(s^→ |s_t^← )=Pr(s^→ |s_{t^{'}}^← ) </math>，若<math>t </math> 和<math>t^{'} </math>对未来状态预测的分布相同，则定义他们具有相同的因果态（casual state）。

+

用来划分集合<math> \overset{\leftarrow}{S}</math>的映射可以有很多种，若某一种划分能够在预测能力最强的同时消耗的计算资源最少，那么它肯定是最优的划分，我们把这种用最优的划分方法得到的状态称为因果态。因果态就是智能体对测量结果进行处理后，根据其内部模型（尤其是状态结构）识别出的斑图，并且这种斑图不随时间发生变化。形式化定义为：对于任意的时刻<math>t </math> 和<math>t^{'} </math>，给定过去状态<math> s_t^← </math>的条件下，未来状态<math> s^→ </math>的分布与给定过去状态<math> s_{t^{'}}^← </math>的条件下，未来状态<math> s^→ </math>的分布相同。那么<math>t </math> 和<math>t^{'} </math>的关系就记作<math>t∼t^{'} </math>，“<math>∼ </math> ” 表示由等效未来状态所引起的等价关系，可以用公式表示为：<math>t∼t^{'} \triangleq Pr(s^→ |s_t^← )=Pr(s^→ |s_{t^{'}}^← ) </math>，若<math>t </math> 和<math>t^{'} </math>对未来状态预测的分布相同，则定义他们具有相同的因果态（casual state）。

[[文件:因果态的定义.jpg|居中|无框|400x400px|替代=]]

如上图所示，左侧的数字代表<math>t</math>时刻的状态序列，右侧的箭头形状代表对未来状态预测的分布，可以观察到<math>t_9</math>和<math>t_{13}</math>时刻的箭头形状完全相同，说明它们对未来状态预测的分布相同，则处于相同的因果态；同样的道理，在<math>t_{11}</math>时刻，它的箭头形状与<math>t_9</math>和<math>t_{13}</math>时刻不同，则处于不同的因果态。

Matthew

272

个编辑

更改

计算力学 (查看源代码)

2024年11月20日 (三) 18:43的版本

导航菜单

搜索