第377行: |
第377行: |
| ==EI的函数性质== | | ==EI的函数性质== |
| ===一阶导数及极值点=== | | ===一阶导数及极值点=== |
− | 由公式{{EquationRef|2}}可以看出,在概率转移矩阵TPM上,EI是关于矩阵中每一个元素(从某一状态到另一状态的条件概率)的函数,于是我们自然会问:这样一个函数具有哪些数学性质?不难看出,该函数是光滑可导,我们可以解析地写出它的一阶导数如下所示, | + | 由公式{{EquationRef|2}}可以看出,在概率转移矩阵P上,EI是关于矩阵中每一个元素(从某一状态到另一状态的条件概率)的函数,于是我们自然会问:这样一个函数具有哪些数学性质?如它有没有极值点?极值点在哪里? |
| + | |
| + | 不失一般性,我们不妨假设对于选定的[math]i,j\in[1,N][/math],[math]p_{ij},p_{iN},\bar{p}_{\cdot j}\equiv \frac{\sum_{k=1}^Np_{kj}}{N},\bar{p}_{\cdot N}\equiv \frac{\sum_{k=1}^Np_{kN}}{N}[/math]都是大于0的,则EI在[math]p_{ij}[/math]附近是可导的,对公式{{EquationRef|2}}求[math]p_{ij}[/math]的一阶导数,并注意到归一化条件[math]\sum_{j=1}^Np_{ij}=1[/math],则就可以得到: |
| | | |
| <math> | | <math> |
第385行: |
第387行: |
| </math> | | </math> |
| | | |
− | 其中,<math>p_{ij}</math>表示TPM中第i行第j列的条件概率,因为TPM每一行有归一化约束条件,所以EI函数本身有<math>N(N-1)</math>个自由变元,我们可以取<math>1\leq i\leq N, 1\leq j\leq N-1</math>。<math>p_{iN}</math>表示第i行第N列的条件概率,<math>\bar{p}_{\cdot j}, \bar{p}_{\cdot N}</math>则分别表示第j列和第N列条件概率的均值。令该式等于0,可以求得极值点:即对于任意的<math>1\leq i\leq N, 1\leq j\leq N-1</math>,都有下式的成立, | + | 其中,<math>p_{ij}</math>表示O中第i行第j列的条件概率,因为P每一行有归一化约束条件,所以EI函数本身有<math>N(N-1)</math>个自由变元,我们可以取<math>1\leq i\leq N, 1\leq j\leq N-1</math>。<math>p_{iN}</math>表示第i行第N列的条件概率,<math>\bar{p}_{\cdot j}, \bar{p}_{\cdot N}</math>则分别表示第j列和第N列条件概率的均值。令该式等于0,可以求得极值点:即对于任意的<math>1\leq i\leq N, 1\leq j\leq N-1</math>,都有下式的成立, |
| | | |
| <math> | | <math> |
第395行: |
第397行: |
| </math> | | </math> |
| | | |
− | 不难计算出,此时<math>EI_{min}=0</math>,即EI达到了极小值。换个角度来看这个公式,这意味着EI的极小值点有很多个,只要转移概率矩阵所有行向量完全一致,无论该行向量本身是怎样的分布,EI都会等于0. | + | 不难计算出,此时<math>EI=0</math>,即EI达到了极小值。换个角度来看这个公式,这意味着EI的极小值点有很多个,只要转移概率矩阵所有行向量完全一致,无论该行向量本身是怎样的分布,EI都会等于0。如果[math]p_{ij},p_{iN},\bar{p}_{\cdot j}\equiv \frac{\sum_{k=1}^Np_{kj}}{N},\bar{p}_{\cdot N}\equiv \frac{\sum_{k=1}^Np_{kN}}{N}[/math]中存在着0,那么EI在此处不可导。 |
| | | |
| ===二阶导数与凸性=== | | ===二阶导数与凸性=== |