更改

跳到导航 跳到搜索
添加19字节 、 2021年9月23日 (四) 15:47
无编辑摘要
第18行: 第18行:  
利用克罗内克积符号和向量化算子操作符<math>\operatorname{vec}</math>,我们可以以下形式重写韦斯特方程:  
 
利用克罗内克积符号和向量化算子操作符<math>\operatorname{vec}</math>,我们可以以下形式重写韦斯特方程:  
 
:<math> (I_m \otimes A +  B^T \otimes I_n) \operatorname{vec}X = \operatorname{vec}C,</math>
 
:<math> (I_m \otimes A +  B^T \otimes I_n) \operatorname{vec}X = \operatorname{vec}C,</math>
 +
    
其中 ''A'' 是 ''n'' ''×'' ''m''的矩阵,''B'' 是''m'' ''×'' ''m''的矩阵,''X'' 是''n'' ''×'' ''m''的矩阵,<math>I_k</math> 是 <math>k \times k</math>的单位矩阵。在这种形式下,该方程可以看作是一个大小为<math>mn \times mn</math>的线性系统<ref>然而,不建议为了数值解重写这种形式的方程,因为这个版本计算代价较高,并且存在病态。</ref>。然而,不建议为了数值解重写这种形式的方程,因为这个版本计算代价较高,并且存在病态。
 
其中 ''A'' 是 ''n'' ''×'' ''m''的矩阵,''B'' 是''m'' ''×'' ''m''的矩阵,''X'' 是''n'' ''×'' ''m''的矩阵,<math>I_k</math> 是 <math>k \times k</math>的单位矩阵。在这种形式下,该方程可以看作是一个大小为<math>mn \times mn</math>的线性系统<ref>然而,不建议为了数值解重写这种形式的方程,因为这个版本计算代价较高,并且存在病态。</ref>。然而,不建议为了数值解重写这种形式的方程,因为这个版本计算代价较高,并且存在病态。
 +
    
'''定理'''。给定矩阵 <math>A\in \mathbb{C}^{n\times n}</math>和<math>B\in \mathbb{C}^{m\times m}</math>,韦斯特方程 <math>AX+XB=C</math>对任意  <math>C\in\mathbb{C}^{n\times m}</math>有唯一解 ''X'' 当且仅当 ''A'' 和''-B'' 不共享任何特征值。
 
'''定理'''。给定矩阵 <math>A\in \mathbb{C}^{n\times n}</math>和<math>B\in \mathbb{C}^{m\times m}</math>,韦斯特方程 <math>AX+XB=C</math>对任意  <math>C\in\mathbb{C}^{n\times m}</math>有唯一解 ''X'' 当且仅当 ''A'' 和''-B'' 不共享任何特征值。
 +
    
'''证明'''。方程<math>AX+XB=C</math>是一个m和n未知的线性系统,涉及和未知数等量的方程。因此,对于任意给定的 C,它是唯一可解的当且仅当齐次方程 <math>
 
'''证明'''。方程<math>AX+XB=C</math>是一个m和n未知的线性系统,涉及和未知数等量的方程。因此,对于任意给定的 C,它是唯一可解的当且仅当齐次方程 <math>
AX+XB=0
+
AX+XB=0</math>仅存在平凡解<math>0</math>。
</math>仅存在平凡解<math>0</math>。
+
 
    
(i)假设 ''A'' 和-''B'' 不共享任何特征值。设 ''X'' 是上述齐次方程的解。于是有 <math>AX=X(-B)</math>,它可以被数学归纳法提升到 <math>
 
(i)假设 ''A'' 和-''B'' 不共享任何特征值。设 ''X'' 是上述齐次方程的解。于是有 <math>AX=X(-B)</math>,它可以被数学归纳法提升到 <math>
A^kX = X(-B)^k
+
A^kX = X(-B)^k</math>
</math>
   
对任意 <math>k \ge 0</math>都成立。因此,对于任意多项式 p,<math>
 
对任意 <math>k \ge 0</math>都成立。因此,对于任意多项式 p,<math>
p(A) X = X p(-B)
+
p(A) X = X p(-B)</math>,特别地,设 <math>p</math> 是 ''A'' 的特征多项式。那么由 Cayley-Hamilton 定理可得<math>p(A)=0</math>。同时谱映射定理告诉我们<math>
</math>,特别地,设 <math>p</math> 是 ''A'' 的特征多项式。那么由 Cayley-Hamilton 定理可得<math>p(A)=0</math>。同时谱映射定理告诉我们<math>
+
\sigma(p(-B)) = p(\sigma(-B)),</math>,其中 <math>\sigma(\cdot)</math>表示矩阵的谱。由于 ''A'' 和-''B'' 不共享任何特征值,<math>p(\sigma(-B))</math>不包含零,因此 <math>p(-B)</math>是非奇异的。从而得到<math>X= 0</math>。这证明了定理的“当”部分。
\sigma(p(-B)) = p(\sigma(-B)),
+
 
</math>,其中 <math>\sigma(\cdot)</math>表示矩阵的谱。由于 ''A'' 和-''B'' 不共享任何特征值,<math>p(\sigma(-B))</math>不包含零,因此 <math>p(-B)</math>是非奇异的。从而得到<math>X= 0</math>。这证明了定理的“当”部分。
      
(ii)现在假设 ''A'' 和-''B'' 有一个相同的特征值 λ。设 u 是 ''A'' 的对应右特征向量,v 是-''B'' 的对应左特征向量,并且 <math>X=u{v}^*</math>。于是<math>X\neq 0</math>,而<math>
 
(ii)现在假设 ''A'' 和-''B'' 有一个相同的特征值 λ。设 u 是 ''A'' 的对应右特征向量,v 是-''B'' 的对应左特征向量,并且 <math>X=u{v}^*</math>。于是<math>X\neq 0</math>,而<math>
 
AX+XB = A(uv^*)-(uv^*)(-B) = \lambda uv^*-\lambda uv^* = 0.
 
AX+XB = A(uv^*)-(uv^*)(-B) = \lambda uv^*-\lambda uv^* = 0.
 
</math>。因此,''X'' 是上述齐次方程的非平凡解。这证明了定理的“仅当”部分得证。
 
</math>。因此,''X'' 是上述齐次方程的非平凡解。这证明了定理的“仅当”部分得证。
 +
    
'''Q.E.D.'''
 
'''Q.E.D.'''
    
作为谱映射定理的另一种形式,证明的第(i)部分<math>p(-B)</math>的非奇异性也可以用贝祖特的互素多项式恒等式来证明。设 q 是-''B'' 的特征多项式。由于 ''A'' 和-''B'' 不共享任何特征值,所以 p 和 q 互素。因此存在多项式 f 和 g,使得 <math>p(z)f(z)+q(z)g(z)\equiv 1</math>。利用 Cayley-Hamilton 定理,可得<math>q(-B)=0</math>,这意味着 <math>p(-B)</math>是非奇异的。
 
作为谱映射定理的另一种形式,证明的第(i)部分<math>p(-B)</math>的非奇异性也可以用贝祖特的互素多项式恒等式来证明。设 q 是-''B'' 的特征多项式。由于 ''A'' 和-''B'' 不共享任何特征值,所以 p 和 q 互素。因此存在多项式 f 和 g,使得 <math>p(z)f(z)+q(z)g(z)\equiv 1</math>。利用 Cayley-Hamilton 定理,可得<math>q(-B)=0</math>,这意味着 <math>p(-B)</math>是非奇异的。
 +
    
这个定理对实矩阵仍然成立,但需要注意的是考虑它们的复特征值。充分条件的证明仍然适用; 对于必要条件的证明,请注意 <math>\mathrm{Re}(uv^*)</math>和 <math>\mathrm{Im}(uv^*)</math> 都满足齐次方程 ''AX + XB = 0'',而它们不能同时为零。
 
这个定理对实矩阵仍然成立,但需要注意的是考虑它们的复特征值。充分条件的证明仍然适用; 对于必要条件的证明,请注意 <math>\mathrm{Re}(uv^*)</math>和 <math>\mathrm{Im}(uv^*)</math> 都满足齐次方程 ''AX + XB = 0'',而它们不能同时为零。
   −
=Roth消去法则=  
+
==Roth消去法则==  
    
给定两个大小分别为''n'' 和 ''m'' 的复方阵 ''A'' 和 ''B'',以及大小为 ''n × m'' 的矩阵 ''C'',我们可以确认下列两个大小为 ''n + m'' 的方阵[math]\begin{bmatrix} A & C \\ 0 & B \end{bmatrix}[/math]和[math]\begin{bmatrix} A & 0 \\0&B \end{bmatrix}[/math]是否相似。当存在矩阵 ''X'' 使得 ''AX-XB'' ''='' ''C'' ,这两个矩阵就是相似的。换句话说,''X'' 是维斯特方程的解。这就是众所周知的'''Roth消去法则'''<ref>{{cite journal|last1=Gerrish|first1=F|last2=Ward|first2=A.G.B|title=Sylvester's matrix equation and Roth's removal rule|journal=The Mathematical Gazette|date=Nov 1998|volume=82|issue=495|pages=423–430|doi=10.2307/3619888}}</ref>。
 
给定两个大小分别为''n'' 和 ''m'' 的复方阵 ''A'' 和 ''B'',以及大小为 ''n × m'' 的矩阵 ''C'',我们可以确认下列两个大小为 ''n + m'' 的方阵[math]\begin{bmatrix} A & C \\ 0 & B \end{bmatrix}[/math]和[math]\begin{bmatrix} A & 0 \\0&B \end{bmatrix}[/math]是否相似。当存在矩阵 ''X'' 使得 ''AX-XB'' ''='' ''C'' ,这两个矩阵就是相似的。换句话说,''X'' 是维斯特方程的解。这就是众所周知的'''Roth消去法则'''<ref>{{cite journal|last1=Gerrish|first1=F|last2=Ward|first2=A.G.B|title=Sylvester's matrix equation and Roth's removal rule|journal=The Mathematical Gazette|date=Nov 1998|volume=82|issue=495|pages=423–430|doi=10.2307/3619888}}</ref>。
 +
    
一种简便的检查方式如下:如果''AX-XB = C'',那么:
 
一种简便的检查方式如下:如果''AX-XB = C'',那么:
    
<math>\begin{bmatrix}I_n & X \\ 0 & I_m \end{bmatrix} \begin{bmatrix} A&C\\0&B \end{bmatrix} \begin{bmatrix} I_n & -X \\ 0& I_m \end{bmatrix} = \begin{bmatrix} A&0\\0&B \end{bmatrix}.</math>
 
<math>\begin{bmatrix}I_n & X \\ 0 & I_m \end{bmatrix} \begin{bmatrix} A&C\\0&B \end{bmatrix} \begin{bmatrix} I_n & -X \\ 0& I_m \end{bmatrix} = \begin{bmatrix} A&0\\0&B \end{bmatrix}.</math>
 +
    
Roth消去法则无法一般化到巴拿赫空间中的无穷维有界算子中。<ref>Bhatia and Rosenthal, p.3</ref>  
 
Roth消去法则无法一般化到巴拿赫空间中的无穷维有界算子中。<ref>Bhatia and Rosenthal, p.3</ref>  
 +
 +
 
==数值解==
 
==数值解==
 
韦斯特方程数值解的一个经典算法是 Bartels-Stewart 算法,该算法通过 QR 算法将 矩阵''A'' 和 ''B'' 转化为舒尔形式,然后通过逆向取代法求解三角矩阵。在LAPACK,或是GNU Octave的lyap函数中,该算法的计算代价是<math>\mathcal{O}(n^3)</math><ref>{{Cite web | url=https://octave.sourceforge.io/control/function/lyap.html | title=Function Reference: Lyap}}</ref>。也可以参阅该语言中的 sylvester 函数。自 GNU Octave Version 4.0以来,不推荐使用<code>syl</code>命令。<ref>{{Cite web | url=https://www.gnu.org/software/octave/doc/interpreter/Functions-of-a-Matrix.html | title=Functions of a Matrix (GNU Octave (version 4.4.1))}}</ref><ref>The <code>syl</code> 命令自从GNU Octave 4.0版本以后就弃用了。</ref>在某些特定的图像处理应用程序中,导出的韦斯特方程有会有解析解<ref>{{cite journal |first=Q. |last=Wei |first2=N.  |last2=Dobigeon |first3=J.-Y.  |last3=Tourneret |title=Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation|journal=IEEE |volume=24 |year=2015 |issue=11 |pages=4109–4121 |doi=10.1109/TIP.2015.2458572|pmid=26208345 |arxiv=1502.03121|bibcode=2015ITIP...24.4109W}}</ref>。
 
韦斯特方程数值解的一个经典算法是 Bartels-Stewart 算法,该算法通过 QR 算法将 矩阵''A'' 和 ''B'' 转化为舒尔形式,然后通过逆向取代法求解三角矩阵。在LAPACK,或是GNU Octave的lyap函数中,该算法的计算代价是<math>\mathcal{O}(n^3)</math><ref>{{Cite web | url=https://octave.sourceforge.io/control/function/lyap.html | title=Function Reference: Lyap}}</ref>。也可以参阅该语言中的 sylvester 函数。自 GNU Octave Version 4.0以来,不推荐使用<code>syl</code>命令。<ref>{{Cite web | url=https://www.gnu.org/software/octave/doc/interpreter/Functions-of-a-Matrix.html | title=Functions of a Matrix (GNU Octave (version 4.4.1))}}</ref><ref>The <code>syl</code> 命令自从GNU Octave 4.0版本以后就弃用了。</ref>在某些特定的图像处理应用程序中,导出的韦斯特方程有会有解析解<ref>{{cite journal |first=Q. |last=Wei |first2=N.  |last2=Dobigeon |first3=J.-Y.  |last3=Tourneret |title=Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation|journal=IEEE |volume=24 |year=2015 |issue=11 |pages=4109–4121 |doi=10.1109/TIP.2015.2458572|pmid=26208345 |arxiv=1502.03121|bibcode=2015ITIP...24.4109W}}</ref>。
 +
    
==相关条目==
 
==相关条目==
第62行: 第70行:  
*代数Riccati方程
 
*代数Riccati方程
   −
==脚注==
+
 
 +
==参考文献==
 
{{Reflist}}
 
{{Reflist}}
 +
    
==引用==
 
==引用==
第72行: 第82行:  
*{{cite journal |first=Q. |last=Wei |first2=N.  |last2=Dobigeon |first3=J.-Y.  |last3=Tourneret |title=Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation|journal=IEEE Transactions on Image Processing |volume=24 |year=2015 |issue=11 |pages=4109–4121 |doi=10.1109/TIP.2015.2458572|arxiv=1502.03121|bibcode=2015ITIP...24.4109W |pmid=26208345}}
 
*{{cite journal |first=Q. |last=Wei |first2=N.  |last2=Dobigeon |first3=J.-Y.  |last3=Tourneret |title=Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation|journal=IEEE Transactions on Image Processing |volume=24 |year=2015 |issue=11 |pages=4109–4121 |doi=10.1109/TIP.2015.2458572|arxiv=1502.03121|bibcode=2015ITIP...24.4109W |pmid=26208345}}
 
*{{cite book|last1=Birkhoff and MacLane|title=A survey of Modern Algebra|publisher=Macmillan|pages=213, 299}}
 
*{{cite book|last1=Birkhoff and MacLane|title=A survey of Modern Algebra|publisher=Macmillan|pages=213, 299}}
 +
    
== 外部链接==
 
== 外部链接==
1,068

个编辑

导航菜单