2021年9月23日 (四) 15:43的版本

西尔韦斯特方程是控制论中的矩阵方程，形式如下^[1]: [math]\displaystyle{ A X + X B = C. }[/math]

其中A，B，C为已知的矩阵，问题是要找到能够满足方程的矩阵X。所有矩阵的系数都是复数。为了使方程有意义，矩阵的行和列需要满足一定条件，A和 B 都要是方阵，大小分别是n和m，而X和C要是n x m列的矩阵，n和m也可以相等，四个矩阵都是大小相同的方阵。

当且仅当 A 和-b 没有共同的本征值时，西尔韦斯特有唯一解 X 。更一般地，方程 [math]\displaystyle{ A X + X B = C. }[/math] 也可以视为(可能无限维中)巴拿赫空间中有界算子的方程。在这种情况下，此情形下，有唯一解 X 的充分必要条件几乎相同: A 和-B 的谱不相交^[2]。

解的存在及唯一

利用克罗内克积符号和向量化算子操作符[math]\displaystyle{ \operatorname{vec} }[/math]，我们可以以下形式重写韦斯特方程:

[math]\displaystyle{ (I_m \otimes A + B^T \otimes I_n) \operatorname{vec}X = \operatorname{vec}C, }[/math]

其中 A 是 n × m的矩阵，B 是m × m的矩阵，X 是n × m的矩阵，[math]\displaystyle{ I_k }[/math] 是 [math]\displaystyle{ k \times k }[/math]的单位矩阵。在这种形式下，该方程可以看作是一个大小为[math]\displaystyle{ mn \times mn }[/math]的线性系统^[3]。然而，不建议为了数值解重写这种形式的方程，因为这个版本计算代价较高，并且存在病态。

定理。给定矩阵 [math]\displaystyle{ A\in \mathbb{C}^{n\times n} }[/math]和[math]\displaystyle{ B\in \mathbb{C}^{m\times m} }[/math]，韦斯特方程 [math]\displaystyle{ AX+XB=C }[/math]对任意 [math]\displaystyle{ C\in\mathbb{C}^{n\times m} }[/math]有唯一解 X 当且仅当 A 和-B 不共享任何特征值。

证明。方程[math]\displaystyle{ AX+XB=C }[/math]是一个m和n未知的线性系统，涉及和未知数等量的方程。因此，对于任意给定的 C，它是唯一可解的当且仅当齐次方程 [math]\displaystyle{ AX+XB=0 }[/math]仅存在平凡解[math]\displaystyle{ 0 }[/math]。

(i)假设 A 和-B 不共享任何特征值。设 X 是上述齐次方程的解。于是有 [math]\displaystyle{ AX=X(-B) }[/math]，它可以被数学归纳法提升到 [math]\displaystyle{ A^kX = X(-B)^k }[/math] 对任意 [math]\displaystyle{ k \ge 0 }[/math]都成立。因此，对于任意多项式 p，[math]\displaystyle{ p(A) X = X p(-B) }[/math]，特别地，设 [math]\displaystyle{ p }[/math] 是 A 的特征多项式。那么由 Cayley-Hamilton 定理可得[math]\displaystyle{ p(A)=0 }[/math]。同时谱映射定理告诉我们[math]\displaystyle{ \sigma(p(-B)) = p(\sigma(-B)), }[/math]，其中 [math]\displaystyle{ \sigma(\cdot) }[/math]表示矩阵的谱。由于 A 和-B 不共享任何特征值，[math]\displaystyle{ p(\sigma(-B)) }[/math]不包含零，因此 [math]\displaystyle{ p(-B) }[/math]是非奇异的。从而得到[math]\displaystyle{ X= 0 }[/math]。这证明了定理的“当”部分。

(ii)现在假设 A 和-B 有一个相同的特征值 λ。设 u 是 A 的对应右特征向量，v 是-B 的对应左特征向量，并且 [math]\displaystyle{ X=u{v}^* }[/math]。于是[math]\displaystyle{ X\neq 0 }[/math]，而[math]\displaystyle{ AX+XB = A(uv^*)-(uv^*)(-B) = \lambda uv^*-\lambda uv^* = 0. }[/math]。因此，X 是上述齐次方程的非平凡解。这证明了定理的“仅当”部分得证。

Q.E.D.

作为谱映射定理的另一种形式，证明的第(i)部分[math]\displaystyle{ p(-B) }[/math]的非奇异性也可以用贝祖特的互素多项式恒等式来证明。设 q 是-B 的特征多项式。由于 A 和-B 不共享任何特征值，所以 p 和 q 互素。因此存在多项式 f 和 g，使得 [math]\displaystyle{ p(z)f(z)+q(z)g(z)\equiv 1 }[/math]。利用 Cayley-Hamilton 定理，可得[math]\displaystyle{ q(-B)=0 }[/math]，这意味着 [math]\displaystyle{ p(-B) }[/math]是非奇异的。

这个定理对实矩阵仍然成立，但需要注意的是考虑它们的复特征值。充分条件的证明仍然适用; 对于必要条件的证明，请注意 [math]\displaystyle{ \mathrm{Re}(uv^*) }[/math]和 [math]\displaystyle{ \mathrm{Im}(uv^*) }[/math] 都满足齐次方程 AX + XB = 0，而它们不能同时为零。

Roth消去法则

给定两个大小分别为n 和 m 的复方阵 A 和 B，以及大小为 n × m 的矩阵 C，我们可以确认下列两个大小为 n + m 的方阵[math]\begin{bmatrix} A & C \\ 0 & B \end{bmatrix}[/math]和[math]\begin{bmatrix} A & 0 \\0&B \end{bmatrix}[/math]是否相似。当存在矩阵 X 使得 AX-XB = C ，这两个矩阵就是相似的。换句话说，X 是维斯特方程的解。这就是众所周知的Roth消去法则^[4]。

一种简便的检查方式如下：如果AX-XB = C，那么：

[math]\displaystyle{ \begin{bmatrix}I_n & X \\ 0 & I_m \end{bmatrix} \begin{bmatrix} A&C\\0&B \end{bmatrix} \begin{bmatrix} I_n & -X \\ 0& I_m \end{bmatrix} = \begin{bmatrix} A&0\\0&B \end{bmatrix}. }[/math]

Roth消去法则无法一般化到巴拿赫空间中的无穷维有界算子中。^[5]

数值解

韦斯特方程数值解的一个经典算法是 Bartels-Stewart 算法，该算法通过 QR 算法将矩阵A 和 B 转化为舒尔形式，然后通过逆向取代法求解三角矩阵。在LAPACK，或是GNU Octave的lyap函数中，该算法的计算代价是[math]\displaystyle{ \mathcal{O}(n^3) }[/math]^[6]。也可以参阅该语言中的 sylvester 函数。自 GNU Octave Version 4.0以来，不推荐使用syl命令。^[7]^[8]在某些特定的图像处理应用程序中，导出的韦斯特方程有会有解析解^[9]。

脚注

↑ 这个方程也有常见的等价形式 AX − XB = C.
↑ Bhatia and Rosenthal, 1997
↑ 然而，不建议为了数值解重写这种形式的方程，因为这个版本计算代价较高，并且存在病态。
↑ Gerrish, F; Ward, A.G.B (Nov 1998). "Sylvester's matrix equation and Roth's removal rule". The Mathematical Gazette. 82 (495): 423–430. doi:10.2307/3619888.
↑ Bhatia and Rosenthal, p.3
↑ "Function Reference: Lyap".
↑ "Functions of a Matrix (GNU Octave (version 4.4.1))".
↑ The syl 命令自从GNU Octave 4.0版本以后就弃用了。
↑ Wei, Q.; Dobigeon, N.; Tourneret, J.-Y. (2015). "Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation". IEEE. 24 (11): 4109–4121. arXiv:1502.03121. Bibcode:2015ITIP...24.4109W. doi:10.1109/TIP.2015.2458572. PMID 26208345.

引用

Sylvester, J. (1884). "Sur l'equations en matrices [math]\displaystyle{ px = xq }[/math]". C. R. Acad. Sci. Paris. 99 (2): 67–71, 115–116.
Bartels, R. H.; Stewart, G. W. (1972). "Solution of the matrix equation [math]\displaystyle{ AX +XB = C }[/math]". Comm. ACM. 15 (9): 820–826. doi:10.1145/361573.361582.
Bhatia, R.; Rosenthal, P. (1997). "How and why to solve the operator equation [math]\displaystyle{ AX -XB = Y }[/math] ?". Bull. London Math. Soc. 29 (1): 1–21. doi:10.1112/S0024609396001828.
Lee, S.-G.; Vu, Q.-P. (2011). "Simultaneous solutions of Sylvester equations and idempotent matrices separating the joint spectrum". Linear Algebra Appl. 435 (9): 2097–2109. doi:10.1016/j.laa.2010.09.034.
Wei, Q.; Dobigeon, N.; Tourneret, J.-Y. (2015). "Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation". IEEE Transactions on Image Processing. 24 (11): 4109–4121. arXiv:1502.03121. Bibcode:2015ITIP...24.4109W. doi:10.1109/TIP.2015.2458572. PMID 26208345.
Birkhoff and MacLane. A survey of Modern Algebra. Macmillan. pp. 213, 299.

外部链接

本中文词条由Fernando参与编译和审校，糖糖编辑，如有问题，欢迎在讨论页面留言。

本词条内容源自wikipedia及公开资料，遵守 CC3.0协议。

[1] 这个方程也有常见的等价形式 AX − XB = C.

[2] Bhatia and Rosenthal, 1997

[3] 然而，不建议为了数值解重写这种形式的方程，因为这个版本计算代价较高，并且存在病态。

[4] Gerrish, F; Ward, A.G.B (Nov 1998). "Sylvester's matrix equation and Roth's removal rule". The Mathematical Gazette. 82 (495): 423–430. doi:10.2307/3619888.

[5] Bhatia and Rosenthal, p.3

[6] "Function Reference: Lyap".

[7] "Functions of a Matrix (GNU Octave (version 4.4.1))".

[8] The syl 命令自从GNU Octave 4.0版本以后就弃用了。

[9] Wei, Q.; Dobigeon, N.; Tourneret, J.-Y. (2015). "Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation". IEEE. 24 (11): 4109–4121. arXiv:1502.03121. Bibcode:2015ITIP...24.4109W. doi:10.1109/TIP.2015.2458572. PMID 26208345.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

@@ 第3行： / 第3行： @@
 |description=西尔韦斯特方程是控制论中的矩阵方程。
 }}
 '''西尔韦斯特方程'''是控制论中的矩阵方程，形式如下<ref>这个方程也有常见的等价形式 ''AX''&nbsp;−&nbsp;''XB''&nbsp;=&nbsp;''C''.</ref>:
 <math>A X + X B = C.</math>
 其中''A''，''B''，''C''为已知的矩阵，问题是要找到能够满足方程的矩阵X。所有矩阵的系数都是复数。为了使方程有意义，矩阵的行和列需要满足一定条件，''A''和 ''B'' 都要是方阵，大小分别是''n''和''m''，而''X''和''C''要是''n x'' ''m''列的矩阵，''n''和''m''也可以相等，四个矩阵都是大小相同的方阵。
 当且仅当 ''A'' 和-''b'' 没有共同的本征值时，西尔韦斯特有唯一解 ''X'' 。更一般地，方程 <math>A X + X B = C.</math> 也可以视为(可能无限维中)巴拿赫空间中有界算子的方程。在这种情况下，此情形下，有唯一解 ''X'' 的充分必要条件几乎相同:  ''A'' 和-''B'' 的谱不相交<ref>Bhatia and Rosenthal, 1997</ref>。
 ==解的存在及唯一==
@@ 第18行： / 第18行： @@
 利用克罗内克积符号和向量化算子操作符<math>\operatorname{vec}</math>，我们可以以下形式重写韦斯特方程:
 :<math> (I_m \otimes A +  B^T \otimes I_n) \operatorname{vec}X = \operatorname{vec}C,</math>
 其中 ''A'' 是 ''n'' ''×'' ''m''的矩阵，''B'' 是''m'' ''×'' ''m''的矩阵，''X'' 是''n'' ''×'' ''m''的矩阵，<math>I_k</math> 是 <math>k \times k</math>的单位矩阵。在这种形式下，该方程可以看作是一个大小为<math>mn \times mn</math>的线性系统<ref>然而，不建议为了数值解重写这种形式的方程，因为这个版本计算代价较高，并且存在病态。</ref>。然而，不建议为了数值解重写这种形式的方程，因为这个版本计算代价较高，并且存在病态。

“韦斯特方程”的版本间的差异

2021年9月23日 (四) 15:43的版本

目录

解的存在及唯一

Roth消去法则

数值解

相关条目

脚注

引用

外部链接

导航菜单

搜索