更改

计算力学 (查看源代码)

2024年11月20日 (三) 16:18的版本

删除244字节、周三16:18

第38行：第38行：

==因果态==

−

智能体对环境的测量精度一般都是有限的，测量结果只能描述环境状态的投影，智能体需要对测量结果[[粗粒化]]后才能识别环境状态投影中的斑图。具体来说，我们可以利用微分的思想，将测量结果的数据划分为若干部分，并将每个斑图的数据独立划分，会观察到在不同的时刻，某些斑图会反复出现。我们可以用同一个字符串来表示这些重复出现的斑图，这样就能简化描述，以此得到模型的最小程序长度，我们可以把这些能够用同一个字符串描述的重复斑图称为“因果态”。

+

智能体需要一种有效的描述方式处理接受到的外部环境信息，使其可以把外部环境信息压缩成一个有限的状态空间，并存储于内部环境模型中。为了找到这种有效的描述方式，我们需要先定义一个叫做“因果态”的概念。

===因果态的定义===

−

~~若将测量对象过去未来的所有信息视为限制在离散值、离散时间上的稳定~~[[随机过程]]，用双无限序列可数集合<math>\overleftrightarrow{S}=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>表示，则测量结果为<math>\overleftrightarrow{S}</math>中任意随机变量的序列。基于时间<math>t</math>可以将<math>\overleftrightarrow{S}</math>分为单侧前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和单侧后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} </math>两个部分，所有可能的未来序列<math>s_t^→</math>形成的集合记作<math> \overrightarrow{S}</math>，所有可能的历史序列<math>\overleftarrow{s_t}</math>形成的集合记作<math> \overleftarrow{S}</math>。

+

智能体对环境的测量精度一般都是有限的，测量结果只能描述环境状态的投影。若将环境过去未来的所有信息视为限制在离散值、离散时间上的稳定[[随机过程]]，用双无限序列可数集合<math>\overleftrightarrow{S}=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>表示，则测量结果为<math>\overleftrightarrow{S}</math>中任意随机变量的序列。基于时间<math>t</math>可以将<math>\overleftrightarrow{S}</math>分为单侧前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和单侧后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} </math>两个部分，所有可能的未来序列<math>s_t^→</math>形成的集合记作<math> \overrightarrow{S}</math>，所有可能的历史序列<math>\overleftarrow{s_t}</math>形成的集合记作<math> \overleftarrow{S}</math>。

按照一定的划分方法（ partition）将<math> \overset{\leftarrow}{S}</math>划分为若干个互斥且全面的子集，那么每个子集就是一个状态，这些划分得到的状态的集合记作<math>\mathcal{R} </math>，划分方法可以是任意函数映射<math> η </math>，用公式表示为<math> \eta{:}\overleftarrow{S}\mapsto\mathcal{R}</math>，也可以将划分得到的状态理解为将<math> \overset{\leftarrow}{S}</math>中的某段序列[[马尔科夫链的粗粒化|粗粒化]]后得到的宏观态。

刘易明

275

个编辑