第375行: |
第375行: |
| ==EI关于p的导数== | | ==EI关于p的导数== |
| ===一阶导数=== | | ===一阶导数=== |
| + | 由公式{{EquationRef|2}}可以看出,在概率转移矩阵TPM上,EI是关于矩阵中每一个元素(从某一状态到另一状态的条件概率)的函数,于是我们自然会问:这样一个函数具有哪些数学性质?不难看出,该函数是光滑可导,我们可以解析地写出它的一阶导数如下所示, |
| | | |
| <math> | | <math> |
| \begin{equation} | | \begin{equation} |
− | EI=\frac{1}{N}\sum_{i=1}^ND_{KL}(P_i||\Bar{P})=\frac{1}{N}\sum_{i=1}^N\sum_{j=1}^Np_{ij}\log\frac{N\cdot p_{ij}}{\sum_{k=1}^Np_{kj}}, | + | \frac{\partial EI}{\partial p_{ij}}=\log\left(\frac{p_{ij}}{p_{iN}}\right)-\log\left(\frac{\bar{p}_{\cdot j}}{\bar{p}_{\cdot N}}\right), |
− | \end{equation}
| + | \end{equation} |
| </math> | | </math> |
| + | |
| + | 其中,<math>p_{ij}</math>表示TPM中第i行第j列的条件概率,<math>p_{iN}</math>表示第i行第N列的条件概率,<math>\bar{p}_{\cdot j}, \bar{p}_{\cdot N}</math>则分别表示第j列和第N列条件概率的均值。 |
| | | |
| ===二阶导数=== | | ===二阶导数=== |