更改

跳到导航 跳到搜索
添加6字节 、 2024年10月19日 (星期六)
第38行: 第38行:  
===奇异值作为椭圆或椭球体的半轴===
 
===奇异值作为椭圆或椭球体的半轴===
   −
如图所示,我们可以将奇异值理解为二维椭圆半轴的长度。这一概念可以推广到<math>n</math>维[[欧几里得空间 Euclidean space]]:任何<math>n \times n</math>方阵的奇异值都可以看作<math>n</math>维椭球体半轴的长度。同理,任何<math>m \times n</math>矩阵的奇异值可以视为<math>m</math>维空间中<math>n</math>维椭球体半轴的长度,比如三维空间中(倾斜的)二维平面上的椭圆。奇异值编码了半轴的长度,而奇异向量则编码了方向。详见下文:
+
如图所示,我们可以将奇异值理解为二维椭圆半轴的长度。这一概念可以推广到<math>n</math>维欧几里得空间(Euclidean space):任何<math>n \times n</math>方阵的奇异值都可以看作<math>n</math>维椭球体半轴的长度。同理,任何<math>m \times n</math>矩阵的奇异值可以视为<math>m</math>维空间中<math>n</math>维椭球体半轴的长度,比如三维空间中(倾斜的)二维平面上的椭圆。奇异值编码了半轴的长度,而奇异向量则编码了方向。详见下文:
    
===<math>\mathbf{U}</math>和<math>\mathbf{V}</math>的列构成正交标准基===
 
===<math>\mathbf{U}</math>和<math>\mathbf{V}</math>的列构成正交标准基===
   −
由于<math>\mathbf{U}</math>和<math>\mathbf{V}^*</math>都是酉矩阵,它们的列分别形成一组[[正交标准向量 orthonormal vectors]],我们可以将其视为[[基向量 basis vectors]]。矩阵<math>\mathbf{M}</math>把基向量<math>\mathbf{V}_i</math>映射到拉伸后的单位向量<math>\sigma_i\mathbf{U}_i</math>上。根据酉矩阵的定义,它们的共轭转置<math>\mathbf{U}^*</math>和<math>\mathbf{V}</math>也具有相同性质,只是失去了奇异值作为拉伸的几何解释。简言之,<math>\mathbf{U}</math>、<math>\mathbf{U}^*</math>、<math>\mathbf{V}</math>和<math>\mathbf{V}^*</math>的列都构成[[标准正交基 orthonormal bases]]。
+
由于<math>\mathbf{U}</math>和<math>\mathbf{V}^*</math>都是酉矩阵,它们的列分别形成一组正交标准向量(orthonormal vectors),我们可以将其视为基向量(basis vectors)。矩阵<math>\mathbf{M}</math>把基向量<math>\mathbf{V}_i</math>映射到拉伸后的单位向量<math>\sigma_i\mathbf{U}_i</math>上。根据酉矩阵的定义,它们的共轭转置<math>\mathbf{U}^*</math>和<math>\mathbf{V}</math>也具有相同性质,只是失去了奇异值作为拉伸的几何解释。简言之,<math>\mathbf{U}</math>、<math>\mathbf{U}^*</math>、<math>\mathbf{V}</math>和<math>\mathbf{V}^*</math>的列都构成标准正交基(orthonormal bases)。
   −
当<math>\mathbf{M}</math>是[[正半定厄米特矩阵 positive-semidefinite Hermitian matrix]]时,<math>\mathbf{U}</math>和<math>\mathbf{V}</math>都等同于用于对角化<math>\mathbf{M}</math>的酉矩阵。然而,如果<math>\mathbf{M}</math>不是正半定厄米特矩阵但仍可对角化,那么其特征分解和奇异值分解就会有所不同。
+
当<math>\mathbf{M}</math>是正半定厄米特矩阵(positive-semidefinite Hermitian matrix)时,<math>\mathbf{U}</math>和<math>\mathbf{V}</math>都等同于用于对角化<math>\mathbf{M}</math>的酉矩阵。然而,如果<math>\mathbf{M}</math>不是正半定厄米特矩阵但仍可对角化,那么其特征分解和奇异值分解就会有所不同。
    
===与四个基本子空间的关系:===
 
===与四个基本子空间的关系:===
第71行: 第71行:  
SVD定理的几何含义可以概括为:对于每个线性映射<math>T:K^n\to K^m</math>,我们能找到<math>K^n</math>和<math>K^m</math>的正交标准基,使<math>T</math>将<math>K^n</math>的第<math>i</math>个基向量映射到<math>K^m</math>的第<math>i</math>个基向量的非负倍数,并将剩余基向量映射到零。在这些基下,映射<math>T</math>表现为一个具有非负实数对角元素的对角矩阵。
 
SVD定理的几何含义可以概括为:对于每个线性映射<math>T:K^n\to K^m</math>,我们能找到<math>K^n</math>和<math>K^m</math>的正交标准基,使<math>T</math>将<math>K^n</math>的第<math>i</math>个基向量映射到<math>K^m</math>的第<math>i</math>个基向量的非负倍数,并将剩余基向量映射到零。在这些基下,映射<math>T</math>表现为一个具有非负实数对角元素的对角矩阵。
   −
为了更直观地理解奇异值和SVD分解(至少在实向量空间中),我们可以考虑<math>\mathbf{R}^n</math>中半径为1的球面<math>S</math>。线性映射<math>T</math>将这个球面映射到<math>\mathbf{R}^m</math>中的一个椭球体。非零奇异值就是这个椭球体[[半轴 semi-axes]]的长度。特别地,当<math>n=m</math>且所有奇异值都不同且非零时,线性映射<math>T</math>的SVD可以分解为三个连续步骤:
+
为了更直观地理解奇异值和SVD分解(至少在实向量空间中),我们可以考虑<math>\mathbf{R}^n</math>中半径为1的球面<math>S</math>。线性映射<math>T</math>将这个球面映射到<math>\mathbf{R}^m</math>中的一个椭球体。非零奇异值就是这个椭球体半轴(semi-axes)的长度。特别地,当<math>n=m</math>且所有奇异值都不同且非零时,线性映射<math>T</math>的SVD可以分解为三个连续步骤:
    
1. 考虑椭球体<math>T(S)</math>及其轴,然后找出<math>\mathbf{R}^n</math>中被<math>T</math>映射到这些轴上的方向。这些方向恰好相互正交。首先应用等距变换<math>\mathbf{V}^*</math>,将这些方向送到<math>\mathbf{R}^n</math>的坐标轴。
 
1. 考虑椭球体<math>T(S)</math>及其轴,然后找出<math>\mathbf{R}^n</math>中被<math>T</math>映射到这些轴上的方向。这些方向恰好相互正交。首先应用等距变换<math>\mathbf{V}^*</math>,将这些方向送到<math>\mathbf{R}^n</math>的坐标轴。
2,464

个编辑

导航菜单