更改

添加525字节 、 2024年10月13日 (星期日)
第594行: 第594行:     
===马尔科夫链的简化===
 
===马尔科夫链的简化===
除了对向量以及高维动力学的降维之外,[[马尔科夫链的简化]]也和因果涌现有着重要的联系。马尔可夫过程的模型约简<ref>Zhang A, Wang M. Spectral state compression of markov processes[J]. IEEE transactions on information theory, 2019, 66(5): 3202-3231.</ref>是状态转移系统建模中的一个重要问题。和因果涌现中的粗粒化相似,马尔科夫链的简化主要也是通过将多个状态合并成一个状态来降低马尔科夫链的复杂度。马尔可夫链的聚类(Lumping Markov Chain)是其中具有代表性的约简方法,其意义主要有三点,第一,我们在研究一个超大的系统的时候,比如复杂城市系统时,并不会关注每一个微观的状态的变化,在粗粒化中我们希望能过滤掉一些我们不感兴趣的噪声和异质性,而从中微观尺度中总结一些中尺度或宏观尺度的规律;第二,有些状态的转移概率非常相似,所以可以被看成同一类状态,对这种马尔科夫链做分区可以减少系统表示的冗余性;第三,在用到马尔科夫决策过程的强化学习里,对马尔科夫链做粗粒化可以减少状态空间的大小,提高训练效率。在许多文献中,粗粒化(coarse-graining)和降维(dimension reduction)是重叠等价的<ref>Coarse graining. ''Encyclopedia of Mathematics.'' URL: <nowiki>http://encyclopediaofmath.org/index.php?title=Coarse_graining&oldid=16170</nowiki></ref>。
+
除了对向量以及高维动力学的降维之外,[[马尔科夫链的简化]](或叫做[[马尔科夫链的粗粒化]])也和因果涌现有着重要的联系。马尔可夫过程的模型约简<ref>Zhang A, Wang M. Spectral state compression of markov processes[J]. IEEE transactions on information theory, 2019, 66(5): 3202-3231.</ref>是状态转移系统建模中的一个重要问题。和因果涌现中的粗粒化相似,马尔科夫链的简化是通过将多个状态合并成一个状态来降低马尔科夫链的复杂度。做简化的意义主要有三点,第一,我们在研究一个超大规模系统的时候,并不会关注每一个微观状态的变化。因此,在粗粒化中我们希望能过滤掉一些我们不感兴趣的噪声和异质性,而从微观尺度中总结出一些中尺度或宏观尺度的规律;第二,有些状态的转移概率非常相似,所以可以被看成同一类状态,对这种马尔科夫链做聚类(也称为对状态做划分,即Partitioning)可以减少系统表示的冗余性;第三,在用到马尔科夫决策过程的强化学习里,对马尔科夫链做粗粒化可以减少状态空间的大小,提高训练效率。在许多文献中,粗粒化(coarse-graining)和降维(dimension reduction)是重叠等价的<ref>Coarse graining. ''Encyclopedia of Mathematics.'' URL: <nowiki>http://encyclopediaofmath.org/index.php?title=Coarse_graining&oldid=16170</nowiki></ref>。
   −
'''给定一个状态分区(state partition) <math>A=\{A_1, A_2, ... ,A_r\}</math>''',我们能够用下列公式描述一个马尔科夫链的聚类过程(lumped process),且这个转移概率对任何初始状态(starting vector) <math> \pi </math> 都是一样的:{{NumBlk|:|
+
其中,对状态空间做粗粒化有硬分块(Hard Partitioning)和软分块(Soft Partitioning)两种。软分块可以被看作把微观状态打散重构出一些宏观状态,允许微观态的叠加而得到宏观态;而硬分块则是严格的微观态分组,把若干个微观状态分成一个组,不允许重叠和叠加。马尔科夫链的粗粒化不仅要对状态空间做,也要对转移矩阵和概率空间做。这三个部分可以同时做,也可以看作为:先对状态空间做,再对转移矩阵和概率空间做;即先对状态做分组,然后再获取对应的粗粒化后的转移矩阵。于是,这就引出了一个新的问题,即状态分组得到的新马尔科夫链中的转移概率应该如何计算?
 +
 
 +
于是,人们提出了可聚类性的概念。首先,对于硬分块方法,我们也叫做马尔可夫链状态聚类(Lumping Markov Chain)约简方法;其次,针对任意的状态划分,我们可以定义所谓的可聚类性(lumpability)的概念。可聚类性(Lumpability)是一种对聚类的衡量,这个概念最早出现在Kemeny, Snell在1969年的有限马尔科夫链(Finite Markov Chains)<ref name=":33">Kemeny, John G., and J. Laurie Snell. ''Finite markov chains''. Vol. 26. Princeton, NJ: van Nostrand, 1969. https://www.math.pku.edu.cn/teachers/yaoy/Fall2011/Kemeny-Snell_Chapter6.3-4.pdf</ref>中。可聚类性(Lumpability)就是一个指标,用来评价“对于某一种硬分块的微观状态分组分案,是否对微观状态转移矩阵是可约简的”。不管状态空间按照哪一个硬分块方案做分类,它都有对应后续的对转移矩阵和概率空间的粗粒化方案<ref>Buchholz, Peter. "Exact and ordinary lumpability in finite Markov chains." ''Journal of applied probability'' 31.1 (1994): 59-75.</ref>。接下来,我们给出正式的定义。
 +
 
 +
'''给定一个状态划分(state partition) <math>A=\{A_1, A_2, ... ,A_r\}</math>''',我们能够用下列公式描述一个马尔科夫链的聚类过程(lumped process),且这个转移概率对任何初始状态(starting vector) <math> \pi </math> 都是一样的:{{NumBlk|:|
 
<math>
 
<math>
 
\begin{aligned}
 
\begin{aligned}
第605行: 第609行:  
</math>
 
</math>
 
|{{EquationRef|3}}}}
 
|{{EquationRef|3}}}}
        第618行: 第621行:  
\end{aligned}
 
\end{aligned}
 
</math>
 
</math>
|{{EquationRef|4}}}}这个公式表达的是,群组<math>A_i</math>到群组<math>A_j</math>的转移概率,其等价于群组<math>A_i</math>中任意状态<math>s_k</math>到群组<math>A_j</math>的转移概率,也等价于群组<math>i</math>中任意状态<math>s_k</math>到群组<math>A_j</math>中的状态的转移概率的和。
+
|{{EquationRef|4}}}}这个公式表达的是,群组<math>A_i</math>到群组<math>A_j</math>的转移概率,其等价于群组<math>A_i</math>中任意状态<math>s_k</math>到群组<math>A_j</math>的转移概率和群组<math>i</math>中任意状态<math>s_k</math>到群组<math>A_j</math>中的状态的转移概率的和。
   −
可聚类性(Lumpability)是一种对分类的衡量,这个概念最早出现在Kemeny, Snell在1969年的有限马尔科夫链(Finite Markov Chains)<ref name=":33">Kemeny, John G., and J. Laurie Snell. ''Finite markov chains''. Vol. 26. Princeton, NJ: van Nostrand, 1969. https://www.math.pku.edu.cn/teachers/yaoy/Fall2011/Kemeny-Snell_Chapter6.3-4.pdf</ref>中。马尔科夫链的粗粒化不仅要对状态空间做,也要对转移矩阵和概率空间做。这三个部分可以同时做,也可以看作为:先对状态空间做,再对转移矩阵和概率空间做;即先对状态做分组,然后再获取对应的粗粒化后的转移矩阵。我们也提到过对状态空间做粗粒化有硬分块(Hard Partitioning)和软分块(Soft Partitioning)两种。软分块可以看作把微观状态打散重构成了一些宏观状态,而硬分块则是更严格的,把若干个微观状态分成一个组。而可聚类性(Lumpability)就是一个指标,用来评价‘对于某一种硬分块的微观状态分组分案,是否对微观状态转移矩阵可约简’。不管状态空间按照哪一个硬分块方案做分类,它都有对应后续的对转移矩阵和概率空间的粗粒化方案<ref>Buchholz, Peter. "Exact and ordinary lumpability in finite Markov chains." ''Journal of applied probability'' 31.1 (1994): 59-75.</ref>,并满足上面提到的粗粒化的两个规则。
+
满足这一条件的马尔科夫链及其状态划分被称为'''可聚类性'''
   −
可聚类的马尔科夫矩阵可以被重新排列成几个新的模块,这种可聚类的矩阵的动力学可逆性也会很高,在这种情况下动力学可逆性和可聚类行是一致的。关于具体的粗粒化马尔科夫链的方法,请参考[[马尔科夫链的粗粒化]]。
+
可聚类的马尔科夫矩阵可以被重新排列成几个新的模块,这种可聚类的矩阵的动力学可逆性也会很高,在这种情况下动力学可逆性和可聚类性是一致的。关于具体的粗粒化马尔科夫链的方法,请参考[[马尔科夫链的粗粒化]]。
    
==参考文献==
 
==参考文献==
786

个编辑