第120行: |
第120行: |
| ===因果态的定义=== | | ===因果态的定义=== |
| | | |
− | 因为智能体的测量装置精度都是有限的,在读取外部环境的测量结果时一般为时间序列上的离散值。测量结果中的某个测量值可能对应某个“隐藏”状态(“隐藏”状态是智能体存储于其内部环境中的已知状态)。若在离散时间序列上不同的测量值对未来的预测有相同的模式,那么它们都对应一个相同的 “隐藏”状态,我们将这个“隐藏”状态称作这些不同测量值的因果态(casual state)。
| + | |
| + | 因为智能体对外部环境的测量精度一般都是有限的,测量结果一般为时间序列上的离散值,可以把它当做限制在离散值、离散时间上的稳定随机过程( Process)。这个随机过程可以记作<math>\overleftrightarrow{S}</math>,<math>\overleftrightarrow{S}=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>是一个双无限序列的可数集合。基于时间<math>t</math>可以将随机过程<math>\overleftrightarrow{S}</math>分为两个部分,单侧前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和单侧后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} s_t</math>,所有可能的历史过程<math>\overleftarrow{s_t}</math>形成的集合记作<math> \overleftarrow{S}</math>,所有未来的过程形成的集合记作<math> \overrightarrow{S}</math>。 |
| + | |
| + | 为了捕捉<math> \overset{\leftarrow}{S}</math>中的有序结构,按照一定的划分方法( partitioni)将<math> \overset{\leftarrow}{S}</math>划分为若干个互斥且全面的子集,那么每个子集就是一个有效态(effective state),这些有效态的集合记作<math>\mathcal{R} </math>,划分方法可以是任意函数映射<math> η </math>,用公式表示为<math> \eta{:}\tilde{\mathbf{S}}\mapsto\mathcal{R}</math>,也可以将有效态理解为将<math> \overset{\leftarrow}{S}</math>中的某段序列粗粒化后得到的宏观态。 |
| + | [[文件:划分示意图.jpg|居中|缩略图|400x400像素]] |
| + | 上图为某种划分方法的示意图,将集合<math> \overset{\leftarrow}{S}</math>划分为某类有效态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>,值得注意的是,<math> \mathcal{R}_i</math>不必形成紧致集,也可以是康托集或其他更特殊的结构,上图为了示意清楚才这样画的。 |
| + | |
| + | 测量结果中的某个测量值可能对应某个“隐藏”状态(“隐藏”状态是智能体存储于其内部环境中的已知状态)。若在离散时间序列上不同的测量值对未来的预测有相同的模式,那么它们都对应一个相同的 “隐藏”状态,我们将这个“隐藏”状态称作这些不同测量值的因果态(casual state)。 |
| [[文件:因果态的定义.jpg|居中|无框|400x400px|替代=]] | | [[文件:因果态的定义.jpg|居中|无框|400x400px|替代=]] |
| 如上图所示,在<math>t_9</math>和<math>t_{13}</math>时刻分别对应一个状态,这两个状态处于相同的因果态,因为对未来的预测具有相同的分布;在<math>t_{11}</math>时刻的状态,则与<math>t_9</math>和<math>t_{13}</math>时刻处于不同的因果态。 | | 如上图所示,在<math>t_9</math>和<math>t_{13}</math>时刻分别对应一个状态,这两个状态处于相同的因果态,因为对未来的预测具有相同的分布;在<math>t_{11}</math>时刻的状态,则与<math>t_9</math>和<math>t_{13}</math>时刻处于不同的因果态。 |
| | | |
| 因果态的形式化定义可以按照如下方式描述: | | 因果态的形式化定义可以按照如下方式描述: |
− |
| |
− | 将测量的数据流<math>s=⋯s_{-2} s_{-1} s_0 s_1 s_2…</math>分为两个部分,按照时间<math>t</math>分为前向序列<math>s_t^→=s_t s_{t+1} s_{t+2} s_{t+3}…</math>和后向序列<math>s_t^←=⋯s_{t-3} s_{t-2} s_{t-1} s_t</math>,可以得到一个单侧前向序列和一个单侧后向序列,它们分别表示<math>s_t</math>关于未来和过去的信息。
| |
| | | |
| 属于相同因果态的两个状态<math>t </math> 和<math>t^{'} </math>,他们之间的关系可以表示为:<math>t∼t^{'} </math>,“<math>∼ </math> ” 表示由等效未来形态所引起的等价关系。那么,就会有如下定义: | | 属于相同因果态的两个状态<math>t </math> 和<math>t^{'} </math>,他们之间的关系可以表示为:<math>t∼t^{'} </math>,“<math>∼ </math> ” 表示由等效未来形态所引起的等价关系。那么,就会有如下定义: |
第135行: |
第140行: |
| | | |
| ===因果态的主要性质=== | | ===因果态的主要性质=== |
− | 将所有历史序列的集合记作<math> \overset{\leftarrow}{S}</math>,将<math> \overset{\leftarrow}{S}</math>按照某种函数映射<math> η </math>划分为若干个互斥且全面的子集,那么每个子集就是一个有效态(effective state),这些有效态的集合记作<math>\mathcal{R} </math>,用公式表示为<math> \eta{:}\tilde{\mathbf{S}}\mapsto\mathcal{R}</math>,也可以将有效态理解为将<math> \overset{\leftarrow}{S}</math>中的某段序列粗粒化后得到的宏观态。划分方法(partition)可以是<math> \overset{\leftarrow}{S}</math>上的任意函数映射,下图为某种划分方法的示意图。
| + | |
− | [[文件:划分示意图.jpg|居中|无框|400x400像素]]
| |
− | 将集合<math> \overset{\leftarrow}{S}</math>划分为某类有效态<math> \mathcal{R}=\{\mathcal{R}_i:i=1,2,3,4\}</math>,值得注意的是,<math> \mathcal{R}_i</math>不必形成紧致集,也可以是康托集或其他更特殊的结构,上图为了示意清楚才这样画的。
| |
| | | |
| 按照最优的划分方法得到的有效态就是因果态,这些因果态的集合记作<math>\mathcal{S} </math>,<math>\mathcal{S} </math>是<math>\mathcal{R} </math>的一种最优形式,原因如下。 | | 按照最优的划分方法得到的有效态就是因果态,这些因果态的集合记作<math>\mathcal{S} </math>,<math>\mathcal{S} </math>是<math>\mathcal{R} </math>的一种最优形式,原因如下。 |