更改

马尔科夫链的粗粒化 (查看源代码)

2024年8月26日 (一) 21:36的版本

添加189字节、 2024年8月26日 (星期一)

无编辑摘要

第1行：第1行：

我们先简单回顾一下马尔科夫矩阵是什么。它是一种square matrix，行列数一样，且满足每一行和为1的条件。

+

而马尔科夫链指的是一个n维的状态的序列[math]\{x_t\ = 1, ..., n\}_{t}[\math]，每一步的状态转换都有马尔科夫矩阵[math]M[\math]决定，即[math]x_{t+1} = M x_t[\math].

−

~~而马尔科夫链指的是一个n维的状态的序列$~~\{x_t\ ~~= 1, ..., n\}_{t}$，每一步的状态转换都有马尔科夫矩阵$M$决定，即$~~x_{t+1} ~~= M x_t$.~~

+

[math]M[\math]的每一行对应的每个状态转移到其他状态的概率。比如当[math]x_t[\math]等于第一个状态的时候，M的第一行展示了[math]x_{t+1}[\math]状态的概率。

−

~~M的每一行对应的每个状态转移到其他状态的概率。比如当$x_t$等于第一个状态的时候，M的第一行展示了$x_{t+1}$状态的概率。~~

那对马尔科夫链做粗粒化做粗粒化的意义是什么呢？我们看到文献中着重强调这两点：

第10行：第10行：

# 有些状态的转移概率非常相似，所以可以被看成同一类状态，对这种马尔科夫链做partitioning可以减少系统表示的冗余性；

# 在用到马尔科夫决策过程的强化学习里，对马尔科夫链做粗粒化可以减少状态空间的大小，提高训练效率。

+

第20行：第21行：

大家理解的线代里的rank秩的定义是看矩阵中的线性无关的行向量的数量，但是这里对秩的理解是从一种类似于信道的概念。

−

秩的定义为我们能找到的一组概率密度函数 f1, . . . , fr, g1, . . . , ~~gr，使得r在下列公式里最小。~~

+

秩的定义为我们能找到的一组概率密度函数 [math]f_1, ... , f_r, g_1, ... , g_r[\math]，使得r在下列公式里最小。

−

$$

+

[math]

P(X_{t+1} | X_{t}) = \sum^r_{k=1} f_k(X_t) g_k(X_{t+1})

−

$$

+

[\math]

+

这里的秩的意思是，我们能多大程度上压缩信道，使得信息在宽度为秩的信道中无损传递。（笔者个人理解）

+

在n个离散状态的马尔科夫矩阵中，[math]f_1, ... , f_r, g_1, ... , g_r[\math] 是维度为n的矩阵。

+

而我们能定义r × r的markov kernel [math]C = \{Cij = \sum_{p=1}^k f_j(k)g_i(k)\}[\math]

+

而且[math]$f_1, ... , f_r$[\math] 为 left Markov features，[math]\{g1, . . . , gr\}[\math] 为 right Markov features.

−

~~这里的秩的意思是，我们能多大程度上压缩信道，使得信息在宽度为秩的信道中无损传递。~~

−

~~在n个离散状态的马尔科夫矩阵中，f1, . . . , fr, g1, . . . , gr 是维度为n的矩阵。~~

−

~~而我们能定义r × r的markov kernel $C = {Cij = \sum_{p=1}^k f_j(k)g_i(k)\}$~~

−

~~而且$f1, . . . , fr$ 为 left Markov features，$\{g1, . . . , gr\}$ 为 right Markov features.~~

+

（未完待续）

Liangjh

48

个编辑