矩阵的标准型
相抵标准型
对于 m × n 阶矩阵 A ,若 r ( A ) = r ,则存在 m 阶可逆矩阵 P 和 n 阶可逆矩阵 Q 使得
P A Q = ( I r O O O )
有理标准型
F = 0 0 ⋮ 0 − a r 1 0 ⋮ 0 − a r − 1 0 1 ⋮ 0 − a r − 2 ⋯ ⋯ ⋱ ⋯ ⋯ 0 0 ⋮ 1 − a 1
F 的行列式因子为 1 , ... , 1 , f ( λ )
f ( λ ) = λ r + a 1 λ r − 1 + ... + a r
设 A 是域 K 上的 n 阶方阵,A 的不变因子组为
1 , ⋯ , 1 , d 1 ( λ ) , ⋯ , d k ( λ ) ,
其中 deg d i ( λ ) = m i ≥ 1 ,则 A 相似于下列分块对角矩阵
F = F 1 F 2 ⋱ F k
其中 F i 的阶等于 m i ,F i 的最后一行由 d i ( λ ) 的系数(除首项系数之外)的负值组成。
设 6 阶矩阵 A 的不变因子为
1 , 1 , 1 , λ − 1 , ( λ − 1 ) 2 , ( λ − 1 ) 2 ( λ + 1 ) ,
则 A 的有理标准型为
1 0 − 1 1 2 0 0 − 1 1 0 1 0 1 1
Jordan标准型
r 阶矩阵
J = λ 0 1 λ 0 1 ⋱ ⋱ λ 0 1 λ 0
J 的初等因子组为 ( λ − λ 0 ) r
( λ − λ 1 ) r 1 , ( λ − λ 2 ) r 2 , ⋯ , ( λ − λ k ) r k ,
则 A 相似于分块对角阵:
J = J 1 J 2 ⋱ J k ,
其中 J i 为 r i 阶矩阵,且
J i = λ i 1 λ i 1 ⋱ ⋱ λ i 1 λ i .
广义Jordan标准型
对于一多项式,我们用F ( P ( λ )) 表示P ( λ ) 的Frobenius块:
F ( P ( λ )) = 0 0 ⋮ 0 − a m 1 0 ⋮ 0 − a m − 1 0 1 ⋮ 0 − a m − 2 ⋯ ⋯ ⋯ ⋯ 0 0 ⋮ 1 − a 1 ,
用C m 表示第( m , 1 ) 元素为1 ,其他元素全为零的m 阶矩阵:
C m = 0 0 ⋮ 0 1 0 0 ⋮ 0 0 0 0 ⋮ 0 0 ⋯ ⋯ ⋯ ⋯ 0 0 ⋮ 0 0 .
设A 是K 上的n 阶矩阵,其不变因子组为1 , ⋯ , 1 , d 1 ( λ ) , ⋯ , d k ( λ ) ,其中d i ( λ ) 是非常数首一多项式,d i ( λ ) ∣ d i + 1 ( λ ) (1 ⩽ i ⩽ k − 1 )。根据定义,所有不变因子d i ( λ ) 的准素因子全体就是A 的初等因子组,因此A 的初等因子必为P ( λ ) e 的形状,其中P ( λ ) 是K 上的首一不可约多项式,e ⩾ 1 。
设P ( λ ) = λ m + a 1 λ m − 1 + ⋯ + a m − 1 λ + a m 是K 上的首一不可约多项式,e 是正整数,则下列矩阵的不变因子组均为1 , ⋯ , 1 , P ( λ ) e :
J e ( P ( λ )) = F ( P ( λ )) O ⋮ O O I m F ( P ( λ )) ⋮ O O O I m ⋮ O O ⋯ ⋯ ⋯ ⋯ O O ⋮ F ( P ( λ )) O O O ⋮ I m F ( P ( λ )) ;
J e ( P ( λ )) = F ( P ( λ )) O ⋮ O O C m F ( P ( λ )) ⋮ O O O C m ⋮ O O ⋯ ⋯ ⋯ ⋯ O O ⋮ F ( P ( λ )) O O O ⋮ C m F ( P ( λ )) .
设 A 是 K 上的 n 阶矩阵, 它在 K 上的初等因子组为 P 1 ( λ ) e 1 , P 2 ( λ ) e 2 , ⋯ , P t ( λ ) e t , 其中 P i ( λ ) 是 K 上的首一不可约多项式, e i ⩾ 1 , 1 ⩽ i ⩽ t , A 在 K 上相似于下列分块对角矩阵:
(1) J = diag { J e 1 ( P 1 ( λ )) , J e 2 ( P 2 ( λ )) , ⋯ , J e t ( P t ( λ ))} ;
(2) J = diag { J e 1 ( P 1 ( λ )) , J e 2 ( P 2 ( λ )) , ⋯ , J e t ( P t ( λ ))} .
设 A 是实数域上的 n 阶矩阵,证明 A 在实数域上相似于下列分块对角矩阵:
(1) J = diag { J r 1 ( λ 1 ) , ⋯ , J r k ( λ k ) , J s 1 ( a 1 , b 1 ) , ⋯ , J s l ( a l , b l )} ;
(2) J = diag { J r 1 ( λ 1 ) , ⋯ , J r k ( λ k ) , J s 1 ( a 1 , b 1 ) , ⋯ , J s l ( a l , b l )} ,
其中 λ 1 , ⋯ , λ k , a 1 , b 1 , ⋯ , a l , b l 都是实数,b 1 , ⋯ , b l 都非零,J r i ( λ i ) 表示以 λ i 为特征值的通常意义下的 Jordan 块,R j = ( a j − b j b j a j ) ,C 2 = ( 0 1 0 0 ) ,且
J s j ( a j , b j ) = R j I 2 R j I 2 ⋱ ⋱ R j I 2 R j , J s j ( a j , b j ) = R j C 2 R j C 2 ⋱ ⋱ R j C 2 R j .
当5阶矩阵 A 的最小多项式为 ( λ − 3 ) ( λ 2 + 1 ) 2 时,写出其在 R 上的Jordan标准型
J 2 ( 0 , 1 ) 是对应不可约二次多项式x 2 + 1 的广义Jordan块,其尺寸为2 ⋅ 2 = 4 :
J 2 ( 0 , 1 ) = ( R 0 I 2 R ) , R = ( 0 − 1 1 0 ) , I 2 = ( 1 0 0 1 ) .
因此显式的5 × 5 形式为
J = 3 0 0 0 0 0 0 − 1 0 0 0 1 0 0 0 0 1 0 0 − 1 0 0 1 1 0 = diag ( 3 , J 2 ( 0 , 1 ) ) .
A = a b 0 0 0 0 − b a 0 0 0 0 0 1 a b 0 0 0 0 − b a 0 0 0 0 0 1 a b 0 0 0 0 − b a ,
求 A 在 R 上的不变因子组
此时对应了实数域上广义Jordan标准型的第二种类型,行列式因子组和不变因子组均为 1 , ... , 1 , (( λ − a ) 2 + b 2 ) 3 . 如果在复数域上求Jordan标准型,那就是 diag { J 3 ( z 0 ) , J 3 ( z 0 ˉ )}
广义Jordan标准型可以处理一般数域上的问题 ,相比几何做法,设标准型则显得更加直观。下面的例子在复数域上用Jordan标准型很好证明,但一般数域的情形下就变得困难
设 V 是数域 K 上的 n 维线性空间,φ 是 V 上的线性变换. 证明:φ 的极小多项式在K 上无重因式的充分必要条件是对 V 的任一 φ -不变子空间 U ,均存在 φ -不变子空间 W ,使得 V = U ⊕ W .
首先证明如下引理
充分性的条件对 V 的任一 φ -不变子空间 U 也满足
证明: 任取 U 的 φ -不变子空间 U 1 ,则 U 1 也是 V 的 φ -不变子空间,因此存在 φ -不变子空间 W ,使得
V = U 1 ⊕ W .令W 1 = U ∩ W ,由于U 1 ⊆ U ,故
U = U ∩ V = U ∩ ( U 1 + W ) = U 1 + U ∩ W = U 1 + W 1 = U 1 ⊕ W 1
充分性:
用反证法, 若 m ( λ ) 有重因式, 那么至少有一个初等因子形如 P ( λ ) r , 其中 P ( λ ) 是数域 K 上的 d 次不可约多项式, r ≥ 2 . 由引理可知, V 的任一 φ -不变子空间都满足性质 P . 因此为了方便叙述, 我们不妨设 V 就是初等因子 P ( λ ) r 的第一类广义 Jordan 块对应的子空间, 或者等价的, φ 只有一个初等因子 P ( λ ) r . 于是存在 V 的一组基 { e 1 , 1 , e 1 , 2 , … , e 1 , d ; … ; e r , 1 , e r , 2 , … , e r , d } , 使 φ 在这组基下的表示矩阵为第一类广义 Jordan 块
J = J r ( P ( λ )) = F ( P ( λ )) I F ( P ( λ )) I ⋱ ⋱ F ( P ( λ )) I F ( P ( λ ))
其中 F = F ( P ( λ )) 是对应于 P ( λ ) 的有理块, I 是单位阵. 令 U = L ( e 1 , 1 , e 1 , 2 , … , e 1 , d ; … ; e r − 1 , 1 , e r − 1 , 2 , … , e r − 1 , d ) , 容易验证 U 是 φ -不变子空间, 于是存在 φ -不变子空间 W , 使得 V = U ⊕ W . 任取 0 = α ∈ W , 设 α = ∑ i = 1 r ∑ j = 1 d c i , j e i , j , 则 c r , 1 , c r , 2 , … , c r , d 不全为零. 设 x = ( c 1 , 1 , c 1 , 2 , … , c 1 , d ; … ; c r , 1 , c r , 2 , … , c r , d ) ′ 为 α 对应的坐标向量, 则向量 P ( φ ) ( α ) 对应的坐标向量为
P ( J ) x = 0 P ′ ( F ) 0 P ′ ( F ) ⋱ ⋱ 0 * P ′ ( F ) 0 x .
注意到 ( P ( λ ) , P ′ ( λ )) = 1 , 故 P ′ ( F ) 是非异阵, 由此不难看出 P ( J ) x = 0 并且它的最后 d 个分量全为零. 因此 0 = P ( φ ) ( α ) ∈ U ∩ W , 矛盾.
必要性:
由假设可知 φ 的初等因子都是 K 上的不可约多项式, 设为 P 1 ( λ ) , P 2 ( λ ) , … , P k ( λ ) , 因此 φ 的广义 Jordan 标准型为 J = diag { F ( P 1 ( λ )) , F ( P 2 ( λ )) , … , F ( P k ( λ ))} . 设广义 Jordan 块 F ( P i ( λ )) 对应的子空间为 V i , 则 V = V 1 ⊕ V 2 ⊕ ⋯ ⊕ V k .
我们对 dim U 进行反向归纳 . 若 dim U = n , 即 U = V , 结论显然成立.
设 dim U > m 时, 结论成立,
现考虑 dim U = m 的情形. 首先断言: 若 U ∩ V i = 0 , 则 V i ⊆ U . 事实上, 注意到 φ ∣ V i 的特征多项式为 P i ( λ ) , 这是 K 上的不可约多项式, 若设 φ 在 U ∩ V i 上限制的特征多项式为 f i ( λ ) , 则容易验证 f i ( λ ) ∣ P i ( λ ) , 从而只能是 f i ( λ ) = P i ( λ ) , 于是 U ∩ V i = V i , 即 V i ⊆ U .
下面依次考虑 U 与 V 1 , V 2 , … , V k 之间的关系. 若 U ∩ V 1 = 0 , 则令 U ′ = U ⊕ V 1 . 注意到 dim U ′ > m , 从而由归纳假设存在 φ -不变子空间 W ′ , 使得 V = U ′ ⊕ W ′ = U ⊕ V 1 ⊕ W ′ , 再令 W = V 1 ⊕ W ′ 即得结论. 若 U ∩ V 1 = 0 , 则 V 1 ⊆ U , 那么接下去考虑 U 与 V 2 之间的关系即可. 一直这样做下去, 最后可知结论成立.
下面来看一个用实数域上的Jordan标准型解决问题的例子
正规矩阵标准型
设 T 是 n 维欧氏空间 V 的正规变换,T 在 V 的标准正交基 η 1 , η 2 , ⋯ , η n 下的矩阵为 A . 若 T 的特征值为 λ i ∈ R ( 1 ⩽ i ⩽ r ) ,a k ± i b k ( b k = 0 , 1 ⩽ k ⩽ s ) ,则存在正交矩阵 P ,使得
P − 1 A P = diag ( λ 1 , λ 2 , ⋯ , λ r , ( a 1 b 1 − b 1 a 1 ) , ⋯ , ( a s b s − b s a s ) ) . ( 1 )
若为复数域上的标准型,只留下 λ i 即可,也就是说正规矩阵在复数域上可正交对角化
**由于正交矩阵,酉矩阵,对称矩阵,反对称矩阵,Hermitian矩阵,反Hermitian矩阵均为正规矩阵,故由正规矩阵的标准型可直接写出这些矩阵的标准型
实对称矩阵:存在实正交矩阵使得
Q T A Q = diag ( μ 1 , … , μ n ) , μ i ∈ R .
Hermitian 矩阵:存在酉矩阵使得
U ∗ A U = diag ( μ 1 , … , μ n ) , μ i ∈ R .
对于反对称矩阵,存在正交矩阵使得
Q T A Q = diag ( J ( μ 1 ) , … , J ( μ k ) , 0 , … , 0 ) ,
每个
J ( μ ) = ( 0 μ − μ 0 ) , μ > 0.
如果阶数为奇数,则一定有0分块
矩阵的分解
一般矩阵分解
满秩分解
如果一个m × n 矩阵A 的秩为r ,那么有m × r 的列满秩矩阵B 和r × n 的行满秩矩阵C ,使得
A = B C
Fitting分解
设 A 为 n 阶复方阵. 求证: 如果 A 不可逆也不是幂零矩阵, 那么存在 n 阶可逆矩阵 P , 使得 P − 1 A P = ( B O O C ) , 其中 B 是可逆矩阵, C 是幂零矩阵, 即存在正整数 m 使得 C m = O .
对于复数域上的情形直接设Jordan标准型即可,但如果是一般的数域,Jordan标准型的方法就不管用了,一个好的办法是将其转换为几何语言,用映射的方式去解决
设 V 是数域 K 上的 n 维线性空间, φ 是V 上的线性变换.证明:存在直和分解
V = V 1 ⊕ V 2 ,
其中V 1 , V 2 是φ -不变子空间,使得φ ∣ V 1 是幂零线性变换, φ ∣ V 2 是可逆线性变换.
设φ 的特征多项式
f ( λ ) =∣ λ I v − φ ∣= λ r ( λ n − r + c 1 λ n − r − 1 + ⋯ + c n − r ) ,
其中c n − r = 0 ( 0 ⩽ r ⩽ n ) . 显然,多项式
f 1 ( λ ) = λ r ,
f 2 ( λ ) = λ n − r + c 1 λ n − r − 1 + ⋯ + c n − r
互素,于是存在直和分解
V = V 1 ⊕ V 2 ,
其中
V i = Ker f i ( φ ) ( i = 1 , 2 ) .
φ ∣ V 1 的特征多项式是 λ r ,所以它是幂零线性变换. φ ∣ V 2 的特征多项式是λ n − r + c 1 λ n − r − 1 + ⋯ + c n − r ,注意到c n − r = 0 ,所以它是可逆线性变换.
根据上面的结论,不难得到另一种形式的分解
V = Ker φ r ⊕ Im φ r
证明: 根据上面的结论,V 1 = Ker φ r ,现在证明 Im φ r ⊆ V 2
设 u = φ r ( v ) , v ∈ V ,则 u ∈ Im φ r ,φ 的特征多项式
f ( λ ) =∣ λ I v − φ ∣= λ r ( λ n − r + c 1 λ n − r − 1 + ⋯ + c n − r ) = 0
于是
( φ n − r + c 1 φ n − r − 1 + ⋯ + c n − r ) u = ( φ n − r + c 1 φ n − r − 1 + ⋯ + c n − r ) φ r ( v ) = f ( φ ) v = 0
于是就证明了 Im φ r ⊆ V 2 ,再由
dim ( V ) = dim ( Ker φ r ) + dim ( Im φ r ) = dim V 1 + dim V 2
就能得到 Im φ r = V 2 ,因此就完成了证明
Voss分解
任何一个矩阵均可表示为两个实对称矩阵的乘积,并且其中至少有一个矩阵可逆
方法1: 拆成共轭的Jordan块处理
证明: 设 A 是 n 阶实方阵, 其 Jordan 标准形为 J = diag ( J 1 , J 2 , ⋯ , J s ) , 其中 J i 是 A 的属于特征值 λ i 的 n i 阶 Jordan 块(i = 1 , 2 , ⋯ , s ), ∑ i = 1 s n i = n . 则存在 n 阶可逆复矩阵 P 使得 P − 1 A P = J . 对每个 Jordan 块 J i , 有
J i = λ i 1 λ i ⋱ ⋱ 1 λ i = 1 λ i ⋯ ⋯ 1 λ i λ i 1 … 1 1 = C i D i , ( 1 )
所以 J = C D , 其中 C = diag ( C 1 , C 2 , ⋯ , C s ) 是对称矩阵, D = diag ( D 1 , D 2 , ⋯ , D s ) 是可逆实对称矩阵. 故
A = P J P − 1 = ( P C P T ) [( P T ) − 1 D P − 1 ] = G H ,
其中 G = P C P T , H = ( P T ) − 1 D P − 1 都是对称矩阵, 并且 H 是可逆矩阵.
现在, 由于 A 为实矩阵, 其虚特征值(如果有的话)必成共轭对出现, 因此可根据 A 的特征值将 J 的对角子块重排, 而 P 的列向量和 D 的子块也作相应重排, 使得
P = ( P ( 1 ) , P ( 2 ) , P ( 3 ) ) , J = J ( 1 ) J ( 2 ) J ( 3 ) , D = D ( 1 ) D ( 2 ) D ( 3 ) ,
其中 J ( 1 ) 仅由 A 的实特征值对应的 Jordan 块构成, J ( 2 ) 与 J ( 3 ) 的各个 Jordan 块分别对应 A 的成共轭对的虚特征值, 其重数也对应相同, 所以 J ( 3 ) = J ˉ ( 2 ) , 从而有 D ( 3 ) = D ˉ ( 2 ) , 且 P ( 3 ) = P ˉ ( 2 ) .
比较 A P = P J , 可得 A P ( 1 ) = P ( 1 ) J ( 1 ) , 因为 A , J ( 1 ) 都是实矩阵, 而 P ( 1 ) 的列向量是 A 的根向量, 此时可都取实向量, 所以 P ( 1 ) 为实矩阵. 此外, 由于
H − 1 = P D − 1 P T = P ( 1 ) D ( 1 ) − 1 P ( 1 ) T + [ P ( 2 ) D ( 2 ) − 1 P ˉ ( 2 ) T + P ˉ ( 2 ) D ˉ ( 2 ) − 1 P ( 2 ) T ]
是两个实矩阵之和, 所以 H − 1 因而 H 是实矩阵, 从而 G = A H − 1 也是实矩阵.
特别, 若 A 只有实特征值, 则 J ( 2 ) 与 J ( 3 ) 不出现; 若 A 没有实特征值, 则 J ( 1 ) 不出现. 此时, 只需在上述相应地方作适当修改即可, 结论成立.
方法2: 实数域上的Jordan标准型
证明: 任取 n 阶实矩阵 A , 记对应的实系数特征多项式为 f ( λ ) , 根据实数域上的标准分解可作如下分解
f ( λ ) = a ( λ − c 1 ) l 1 ⋯ ( λ − c p ) l p [( λ − a 1 ) 2 + b 1 2 ] l p + 1 ⋯ [( λ − a q ) 2 + b q 2 ] l p + q
其中 b 1 , ⋯ , b q 都不为零. 令二阶矩阵 B i = ( a i b i − b i a i ) , C = ( 0 1 0 0 ) , 则矩阵 B i 的特征多项式为 ( λ − a i ) 2 + b i 2 , 且 2 k 阶实矩阵
B ik = B i C B i C ⋱ ⋱ B i C B i
的最小多项式为特征多项式 [( λ − a i ) 2 + b i 2 ] k . 此时由广义Jordan标准型 ,存在实矩阵
A 1 = diag { J t 1 , ⋯ , J t s , B 1 k 1 , ⋯ , B r k r }
相似于矩阵 A , 其中 J t i 是形如 J k ( c i ) 的若尔当块, B i k i 是形如上面 B ik 的矩阵. 现在令 H 2 k 为副对角线上元素都为 1 , 其余元素都为 0 的 2 k 阶矩阵, 则对称矩阵 H 2 k 满足 H 2 k = H 2 k − 1 , 可使 B ik H 2 k 为实对称矩阵 , 此时矩阵 A 1 有分解
A 1 = J t 1 H t 1 ⋱ J t s H t s B 1 k 1 H 2 k 1 ⋱ B r k r H 2 k r H t 1 ⋱ H t s H 2 k 1 ⋱ H 2 k r = T 1 T 2
这时 T 1 , T 2 为实对称矩阵. 因为存在实可逆矩阵 P 满足
A = P A 1 P − 1 = P T 1 T 2 P − 1 = ( P T 1 P ′ ) [( P − 1 ) ′ T 2 P − 1 ]
其中 P T 1 P ′ 与 ( P − 1 ) ′ T 2 P − 1 为对称矩阵, 且后者可逆, 到此证毕!
Jordan-Chevalley分解
设 V 是复数域上的 n 维线性空间, A 是 V 上的线性变换, 则
(1) 存在 V 上唯一的线性变换 B , N , 使得 A = B + N , 且 B N = N B , 其中 B 是可对角化变换, N 是幂零变换;
(2) 存在常数项为零的复多项式 p ( x ) , q ( x ) , 使得 B = p ( A ) , N = q ( A ) .
证明: 设线性变换 A 的特征多项式为
f ( λ ) = ( λ − λ 1 ) n 1 ( λ − λ 2 ) n 2 ⋯ ( λ − λ s ) n s ,
其中 λ 1 , λ 2 , ⋯ , λ s 是 A 的所有互不相同的特征值, n 1 + n 2 + ⋯ + n s = n .
根据中国剩余定理, 关于多项式 p ( x ) 的同余方程组
⎩ ⎨ ⎧ p ( x ) ≡ λ 1 p ( x ) ≡ λ 2 ⋯⋯⋯⋯ p ( x ) ≡ λ s p ( x ) ≡ 0 ( mod ( λ − λ 1 ) n 1 ) , ( mod ( λ − λ 2 ) n 2 ) , ( mod ( λ − λ s ) n s ) , ( mod ( λ )) ,
有解 p ( x ) . 令 q ( x ) = x − p ( x ) , 则 p ( x ) , q ( x ) 的常数项显然都为 0. 这里, 若 0 是 A 的特征值, 则去掉最后一个同余式.
令 B = p ( A ) , N = q ( A ) = A − p ( A ) , 则 A = B + N . 且 B N = N B . 下证 B 是可对角化的. 为此, 考虑 V 的根子空间分解:
V = W 1 ⊕ W 2 ⊕ ⋯ ⊕ W s ,
其中 W i = ker ( A − λ i I ) n i , i = 1 , 2 , ⋯ , s . 而 W i 是 A 的不变子空间. 易知, A 限制在 W i 上的特征多项式为 ( λ − λ i ) n i .
因为 p ( λ ) − λ i 能被 ( λ − λ i ) n i 整除, 所以 p ( A ) − λ i I 是 W i 上的零变换, 即 p ( A ) ∣ W i = λ i I ∣ W i 是 W i 上的数乘变换. 因此, p ( A ) 在 V 上可对角化.
另一方面, N ∣ W i = ( A − B ) ∣ W i = ( A − p ( A )) ∣ W i = ( A − λ i I ) ∣ W i ,由 W i 的定义,因此 N 在每个 W i 上都是幂零的, 从而 N 是 V 上的幂零变换.
最后, 我们证明分解是唯一的. 设 A = B ′ + N ′ , 是满足条件的另一个分解, 则
B − B ′ = N ′ − N .
注意到 B ′ 与 A 可交换, 因而与 B 可交换. 所以 B , B ′ 可同时对角化(因为两个可交换并且可对角化的变换可同时对角化). 所以 N ′ − N 可对角化,另外, N , N ′ 可交换, 所以 N ′ − N 是幂零的. 容易证明, 可对角化的幂零变换必为零变换, 这就证明了 B = B ′ , 从而 N = N ′ .
接下来我们证明一般数域上的Jordan-Chevalley分解
在复数域上我们通过将特征多项式分解为一次因式来进行构造,但一般数域下可能并不能分解的那么“干净”,此时就需要一般数域上的标准型进行构造
设 A 是数域 K 上的 n 阶矩阵,证明存在 K 上的 n 阶矩阵 B , C ,使得 A = B + C ,且满足
(1) B 在复数域上可对角化;(2) C 是幂零矩阵;(3) B C = C B ,
并且满足上述条件的分解一定是唯一的.
证明: 设 A 在 K 上的初等因子组为P 1 ( λ ) e 1 , P 2 ( λ ) e 2 , ⋯ , P t ( λ ) e t ,其中
P i ( λ ) 是 K 上的首一不可约多项式,e i ≥ 1 ,1 ≤ i ≤ t . 由广义Jordan标准型 ,存在 K 上的可逆矩阵 P ,使得
P − 1 A P = J = diag { J e 1 ( P 1 ( λ )) , J e 2 ( P 2 ( λ )) , ⋯ , J e t ( P t ( λ ))} .
我们先对广义Jordan块 J e i ( P i ( λ )) 来证明结论,为方便起见,记 F i = F ( P i ( λ )) 。
由于 P i ( λ ) 在 K 上不可约,故( P i ( λ ) , P i ′ ( λ )) = 1 ,从而 P i ( λ ) 在复数域上无重根,于是 F i 在复数域上可对角化,令
M i = F i O ⋮ O O O F i ⋮ O O O O ⋮ O O ⋯ ⋯ ⋯ ⋯ O O ⋮ F i O O O ⋮ O F i , N i = O O ⋮ O O I O ⋮ O O O I ⋮ O O ⋯ ⋯ ⋯ ⋯ O O ⋮ O O O O ⋮ I O .
则容易验证
J e i ( P i ( λ )) = M i + N i , M i N i = N i M i .
M i 可复对角化,N i 幂零,再令
M = diag { M 1 , ⋯ , M t } , N = diag { N 1 , ⋯ , N t } ,
则
J = M + N , M N = N M .
M 可复对角化,N 幂零,最后令
B = P M P − 1 , C = P N P − 1 ,
则 B , C 是 K 上的矩阵,并且
A = B + C , B C = C B .
从而 B 可复对角化,C 幂零,至于唯一性的证明,可以先将 A , B , C 看作是复数域上的矩阵,然后由于任何数域都可以嵌入复数域,因此就能得到在 K 上的唯一性
奇异值分解
设 A 是 m × n 实矩阵, rank A = r , 则存在 m 阶正交矩阵 U 与 n 阶正交矩阵 V , 使得 A = U ( Σ O O O ) V T , 其中 Σ = diag ( σ 1 , σ 2 , … , σ r ) , 而 σ 1 ≥ σ 2 ≥ ⋯ ≥ σ r > 0 。
证明: 设 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ r > 0 是半正定矩阵 A A T 的非零特征值(显然为实数), u 1 , u 2 , … , u r 是对应的标准正交化特征向量, 则 A A T u j = λ j u j , j = 1 , 2 , … , r 。记 v j = σ j 1 A T u j , 其中 σ j = λ j , j = 1 , 2 , … , r , 可以验证: v 1 , v 2 , … , v r 是 A T A 的属于特征值 λ 1 , λ 2 , … , λ r 的标准正交化特征向量。
又设 u r + 1 , … , u m 是 A A T 的属于特征值 0 的标准正交化特征向量, v r + 1 , … , v n 是 A T A 的属于特征值 0 的标准正交化特征向量, 令
U = ( u 1 , … , u r , u r + 1 , … , u m )
V = ( v 1 , … , v r , v r + 1 , … , v n )
则 U 与 V 分别是 m 阶和 n 阶正交矩阵. 注意到 u j T A = 0 , j = r + 1 , … , m , 所以
A = U U T A = ( u 1 u 1 T + u 2 u 2 T + ⋯ + u m u m T ) A
= σ 1 u 1 v 1 T + σ 2 u 2 v 2 T + ⋯ + σ r u r v r T
= U ( Σ O O O ) V T
复数域上的结论同理可证存在酉矩阵 U , V 满足条件
下面是奇异值分解的一个应用
A 为 n 阶实矩阵, 证明: 若存在实矩阵 P , 使得 A T = A P , 则存在正交
矩阵 Q , 使得 Q − 1 A Q 形如
( B O O O )
其中 B 为可逆矩阵.
证明: 设 A 的奇异值分解为 A = U Σ V T ,其中 U = ( u 1 , ... , u r , ... , u n ) , V = ( v 1 , ... , v r , ... , v n ) , Σ = ( Σ r O O O )
要证明原命题,即证明存在正交矩阵 Q ,使得
U ( Σ r O O O ) V T = Q ( B O O O ) Q T
因此如果能将 U 表示为 V 和另一个矩阵的乘积,便可以得到上面的式子,记
U 1 = { u 1 , ... , u r } , V 1 = { v 1 , ... , v r } , U 2 = { u r + 1 , ... , u n } , V 2 = { v r + 1 , ... , v n }
由奇异值分解的几何意义,U 1 是 Col ( A ) 的一组标准正交基,V 1 是 Row ( A ) 的一组标准正交基,U 2 是 ker ( A T ) 的一组标准正交基,V 2 是 ker ( A ) 的一组标准正交基
由于 A T = A P ,这说明 Col ( A ) = Row ( A ) ,又因为 ker ( A ) = Row ( A ) ⊥ ,ker ( A T ) = Col ( A ) ⊥ ,因此 ker ( A ) = ker ( A T ) ,于是存在正交矩阵 P 1 , P 2 使得
U 1 = V 1 P 1 , U 2 = V 2 P 2
代入 A 的奇异值分解就有
A = U ( Σ r O O O ) V T = ( U 1 , U 2 ) ( Σ r O O O ) ( V 1 T V 2 T ) = ( V 1 , V 2 ) ( P 1 O O P 2 ) ( Σ r O O O ) ( V 1 T V 2 T ) = ( V 1 , V 2 ) ( P 1 Σ r O O O ) ( V 1 T V 2 T )
此时 Q = ( V 1 , V 2 ) = V , B = P 1 Σ r ,于是我们就完成了证明
极分解
n 阶实(复)矩阵 A 可分解如下
A = QS = S 1 Q
其中 Q 是正交矩阵(酉矩阵),S , S 1 是半正定实对称矩阵(Hermite矩阵)
方法1: 若 A 可逆,因为A 为实矩阵,所以A A T 为实对称矩阵.
x T ( A A T ) x = ( A T x ) T ( A T x ) ≥ 0.
所以A A T 是正定矩阵. 由半正定矩阵的k次方根 ,存在正定对称矩阵 P ,使 A A T = P 2 . 取 U = P ( A T ) − 1 ,则 A = P U . 容易验证:U T U = E ,即 U 是正交矩阵。
方法2: 利用奇异值分解
A = U ( Σ O O O ) V T = U V T ( V ( Σ O O O ) V T ) := QS
另一个方向同理可得,反向也能用极分解推出奇异值分解
QR分解
设 A 是 n 阶实可逆矩阵. 存在正交矩阵 Q 和主对角元全为正实数的上三角矩阵 R , 使得 A = QR , 并且这个表达式是唯一的.
方法1:
证明: 存在性. 把 A 按列分块为 A = ( α 1 , α 2 , ⋯ , α n ) , 由于 det A = 0 , 所以向量组 α 1 , α 2 , ⋯ , α n 线性无关. 根据 Schmidt 正交化方法, 可得到与 α 1 , α 2 , ⋯ , α n 等价的正交向量组 β 1 , β 2 , ⋯ , β n , 即
β 1 β 2 β n = α 1 , = α 2 − ( β 1 , β 1 ) ( α 2 , β 1 ) β 1 , ⋯ = α n − i = 1 ∑ n − 1 ( β i , β i ) ( α n , β i ) β i .
再单位化, 得 η j = ∣ β j ∣ 1 β j , j = 1 , 2 , ⋯ , n . 因此 η 1 , η 2 , ⋯ , η n 是标准正交向量组, 且
α 1 α 2 α n = β 1 = ∣ β 1 ∣ η 1 , = ( β 1 , β 1 ) ( α 2 , β 1 ) β 1 + β 2 = ∣ β 1 ∣ ( α 2 , β 1 ) η 1 + ∣ β 2 ∣ η 2 , ⋯ = i = 1 ∑ n − 1 ( β i , β i ) ( α n , β i ) β i + β n = i = 1 ∑ n − 1 ∣ β i ∣ ( α n , β i ) η i + ∣ β n ∣ η n .
令 t j j = ∣ β j ∣ , j = 1 , 2 , ⋯ , n ; t ij = ∣ β i ∣ ( α j , β i ) , i = 2 , 3 , ⋯ , n ; j = 1 , 2 , ⋯ , i − 1 , 则
A = ( α 1 , α 2 , ⋯ , α n ) = ( η 1 , η 2 , ⋯ , η n ) t 11 0 ⋮ 0 t 12 t 22 ⋮ 0 ⋯ ⋯ ⋯ t 1 n t 2 n ⋮ t nn := QR ,
其中 Q = ( η 1 , η 2 , ⋯ , η n ) 是正交矩阵, R 是主对角元 t ii 全大于零的实上三角矩阵.
再证唯一性. 设 A = Q 1 R 1 是满足要求的另一个分解, 则 Q 1 R 1 = QR , 即 Q − 1 Q 1 = R R 1 − 1 . 可见 Q − 1 Q 1 = R R 1 − 1 既是正交矩阵又是上三角矩阵, 因而必为对角矩阵, 且主对角元等于 1 或 − 1 . 但 R 1 和 R 的主对角元都为正, 故 R R 1 − 1 = E , 即 R = R 1 , 从而 Q = Q 1 .
方法2:
定义如下初等变换矩阵
P ( i , j ; θ ) := 1 ⋱ 1 cos θ − sin θ ⋱ sin θ cos θ 1 ⋱ 1
为 Givens 矩阵 (变换), 它是通过将一个 n 阶单位阵 E n 更改四个位置的元素得到的:
p ii = p j j = cos θ , p ij = − p j i = sin θ .
这对应了 { e i , e j } 平面上的一个旋转, θ 称为旋转角. 可以验证它是正交矩阵. 以及以下均假设 1 ≤ i < j ≤ n . 设 P 如上定义, 对矩阵 A = ( a ij ) n × n 做一次变换 P A , 可以让矩阵中一个元素 a j i 变为零, 以下假设 a j i = 0 否则不需要做变化:
取 sin θ = a j i 2 + a j i 2 a j i , cos θ = a ii 2 + a j i 2 a ii .
B = ( b ij ) = P A 只改变 A 的第 i , j 行元素, 且
( b ik b j k ) = ( cos θ − sin θ sin θ cos θ ) ( a ik a j k ) .
由此, b j i = 0 . 不断施加这样的运算, 可以让 A 的对角线以下元素均为零, 这里最多需要 2 n ( n − 1 ) 次变换. 假设为把 a j i 处变为零,那么 A 通过一系列的正交变换 P := ∏ 1 ≤ i < j ≤ n P ( i , j ) 之后变为上三角矩阵 R , 这也就验证了 QR 分解:
A = P R .
方法3: 因为 A T A 为正定矩阵,于是由Cholesky分解 ,存在主对角元均大于0的实上三角矩阵 U ,使得
A T A = U T U
取 P = ( A T ) − 1 U T ,则 A = P U ,其中 P 为正交矩阵
LU分解
对于 A ∈ F n × n ,存在 C , B ∈ F n × n 使得 A = B C ,其中 B 为主对角线均为 1 的下三角矩阵,C 为上三角矩阵.
C 为可逆上三角矩阵的充要条件是 A 的顺序主子式全不为0(或 a ii = 0 ),并且此时分解是唯一的
方法1: 使用归纳法
充分性 : 当 n = 1 命题显然成立. 设命题对 n − 1 时成立, 当 n 时, 设
A = ( A n − 1 β T α a nn ) , A n − 1 ∈ F ( n − 1 ) × ( n − 1 ) , α , β ∈ F n − 1 , a nn ∈ F .
由归纳假设, 存在 C n − 1 , B n − 1 ∈ F ( n − 1 ) × ( n − 1 ) 使得 A n − 1 = B n − 1 C n − 1 其中 B n − 1 为主对角元都为 1 的下三角矩阵, C n − 1 为可逆上三角矩阵. 注意到
A = ( A n − 1 β T α a nn ) = ( B n − 1 C n − 1 β T α a nn ) → ( B n − 1 C n − 1 0 α a nn − β T C n − 1 − 1 B n − 1 − 1 α ) ,
对应的初等行变换矩阵如下
( E n − 1 − β T C n − 1 − 1 B n − 1 − 1 0 1 ) A = ( B n − 1 C n − 1 0 α a nn − β T C n − 1 − 1 B n − 1 − 1 α ) .
于是我们有
A = ( E n − 1 − β T C n − 1 − 1 B n − 1 − 1 0 1 ) − 1 ( B n − 1 0 0 1 ) ( C n − 1 0 B n − 1 − 1 α a nn − β T C n − 1 − 1 B n − 1 − 1 α ) = B C ,
其中
B = ( E n − 1 β T C n − 1 − 1 B n − 1 − 1 0 1 ) ( B n − 1 0 0 1 ) = ( B n − 1 β T C n − 1 − 1 0 1 )
是主对角元都为 1 的下三角矩阵 (因为 B n − 1 是), 且
C = ( C n − 1 0 B n − 1 − 1 α a nn − β T C n − 1 − 1 B n − 1 − 1 α )
是上三角矩阵 (因为 C n − 1 是). 因为 det A = 0 , 所以 C 是可逆矩阵.(顺序主子式不为0的条件保证了归纳的合理性 )
必要性: 当 n = 1 命题显然成立. 假设命题对 n − 1 时成立, 则当 n 时, 设 A = B C 且 B 为主对角元都为 1 的下三角矩阵, C 为可逆上三角矩阵.
假设
B = ( B n − 1 ′ γ T 0 1 ) , C = ( C n − 1 ′ 0 η c nn ) , B n − 1 ′ , C n − 1 ′ ∈ F ( n − 1 ) × ( n − 1 ) , c nn ∈ F ∖ { 0 } .
现在就有
A = B C = ( B n − 1 ′ C n − 1 ′ γ T C n − 1 ′ B n − 1 ′ η γ T η + c nn ) .
由归纳假设知 B n − 1 ′ C n − 1 ′ 顺序主子式不为 0 . 显然 det A = 0 , 这就证明了 n 的情况
唯一性: 若还有 A = B C = B ′ C ′ , 这里 B ′ 为主对角元都为 1 的下三角矩阵, C ′ 为可逆上三角矩阵. 于是
C ( C ′ ) − 1 = B − 1 B ′ .
注意到上式左边是上三角矩阵, 右边是主对角线全为 1 的下三角矩阵, 故
C ( C ′ ) − 1 = B − 1 B ′ = E n ,
从而 C = C ′ , B = B ′ , 这就完成了证明.
方法2: Gauss消元法
要进行Gauss消元法需要对角元不为0,下面的引理证明了对角元不为0和顺序主子式不为0的等价性
对角元素 a ii ( i ) = 0 (i = 1 , 2 , … , k ) 的充要条件是矩阵 A 的顺序主子式 D i = 0 (i = 1 , 2 , … , k ), 即
D 1 = a 11 = 0 ,
D i = a 11 ⋮ a i 1 ⋯ ⋱ ⋯ a 1 i ⋮ a ii = 0 ( i = 2 , 3 , … , k ) .
证明: 采用归纳法证明引理的充分性. 显然, 当 k = 1 时引理的充分性是成立的. 现假设引理对 k − 1 是成立的, 求证引理对 k 亦成立. 由归纳法, 设 a ii ( i ) = 0 (i = 1 , 2 , … , k − 1 ), 于是可用 Gauss 消去法将 A ( 1 ) = A 约化到 A ( k ) 中, 即
A ( 1 ) → A ( k ) = a 11 ( 1 ) a 12 ( 1 ) a 22 ( 2 ) ⋯ ⋯ ⋱ ⋯⋯⋯⋯ a 1 n ( 1 ) ⋯⋯⋯⋯ a 2 n ( 2 ) ⋮ a k k ( k ) ⋮ a nk ( k ) ⋯ ⋱ ⋯ a k n ( k ) ⋮ a nn ( k ) ,
且有
D 2 = a 11 ( 1 ) 0 a 12 ( 1 ) a 22 ( 2 ) = a 11 ( 1 ) a 22 ( 2 ) , D 3 = a 11 ( 1 ) a 22 ( 2 ) a 33 ( 3 ) ,
D k = a 11 ( 1 ) a 12 ( 1 ) a 22 ( 2 ) ⋯ ⋯ ⋱ a 1 k ( 1 ) a 2 k ( 2 ) ⋮ a k k ( k ) = a 11 ( 1 ) a 22 ( 2 ) ⋯ a k k ( k ) . ( ⋆ )
由设 D i = 0 (i = 1 , 2 , … , k ) , 有 a k k ( k ) = 0 , 即引理对 k 的充分性成立.
必要性则由 ( ⋆ ) 式显然可得
现在用Gauss消元法证明LU分解
设线性方程组
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 , ⋮ a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n , ( 1 )
或写成矩阵形式 A x = b , 其中
A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a nn , x = x 1 x 2 ⋮ x n , b = b 1 b 2 ⋮ b n .
设 A 的各顺序主子式均不为零. 于是由引理,可以进行Gauss消元法 ,由于对 A 施行行的初等变换相当于用初等矩阵左乘 A , 于是对式 (1) 施行第一次消元后 a 11 下面的元素全部变为0 ,记 A := A ( 1 ) ,这时 A ( 1 ) 化为 A ( 2 ) , b ( 1 ) 化为 b ( 2 ) , 即
L 1 A ( 1 ) = A ( 2 ) , L 1 b ( 1 ) = b ( 2 ) ,
其中
L 1 = 1 − m 21 − m 31 ⋮ − m n 1 1 0 1 ⋱ ⋱ 1 .
一般第 k 步消元, A ( k ) 化为 A ( k + 1 ) , b ( k ) 化为 b ( k + 1 ) , 相当于
L k A ( k ) = A ( k + 1 ) , L k b ( k ) = b ( k + 1 ) .
重复这一过程, 最后得到
{ L n − 1 ⋯ L 2 L 1 A ( 1 ) = A ( n ) , L n − 1 ⋯ L 2 L 1 b ( 1 ) = b ( n ) ,
其中
L k = 1 ⋱ 1 − m k + 1 , k ⋮ − m nk 1 ⋱ 1 .
将上三角矩阵 A ( n ) 记作 U , 于是
A = L 1 − 1 L 2 − 1 ⋯ L n − 1 − 1 U = LU ,
其中
L = L 1 − 1 L 2 − 1 ⋯ L n − 1 − 1 = 1 m 21 m 31 ⋮ m n 1 1 m 32 ⋮ m n 2 1 ⋱ ⋯ ⋱ m n , n − 1 1
为单位下三角矩阵. 于是我们就完成了证明
正规矩阵的分解
半正定矩阵的k次方根
设 A 是 n 阶半正定实对称矩阵,则对任意的正整数 k > 1 ,必存在唯一的 n 阶半正定实对称矩阵 B ,使得
A = B k .
这样的半正定阵 B 称为半正定阵 A 的k 次方根,记为B = A k 1 .
证明: 设P 是正交矩阵,使得P T A P = diag { λ 1 , λ 2 , ⋯ , λ n } ,其中λ i ≥ 0 是A 的特征值.令
B = P diag { λ 1 k 1 , λ 2 k 1 , ⋯ , λ n k 1 } P T
则B 为半正定阵且A = B k 这就证明了 k 次方根的存在性.
设B 是A 的k 次方根,则对B 的任一特征值μ i , μ i k 是A 的特征值,即μ i 是A 的某个特征值的非负k 次方根. 由Largrange插值法,不难证明存在一个只和A 的所有特征值的非负k 次方根有关的实系数多项式f ( x ) ,使得B = f ( B k ) = f ( A ) .设C 是A 的另一个k 次方根,则同上讨论也有C = f ( A ) ,从而B = C ,这就证明了k 次方根的唯一性.
Cholesky分解
设A 是 n 阶正定实对称矩阵,则存在实 n 阶上三角矩阵 L ,且 L 的主对角线上的元素均不为零,使
A = L L T .
方法1: 对 n 用归纳法.
当 n = 1 时,结论显然成立. 设 n ≥ 2 ,并假设 n − 1 阶结论成立,下证对于 n 阶正定矩阵 A 结论也成立. 将 A 块分为 A = ( a 11 β β T A 1 ) ,其中 β 是 n − 1 阶实列向量,A 1 为 n − 1 阶实对称矩阵.
因为 A 正定,所以 A 1 也是正定的,从而是可逆的. 于是有
( 1 0 − β T A 1 − 1 E n − 1 ) ( a 11 β β T A 1 ) ( 1 − A 1 − 1 β 0 E n − 1 ) = ( a 11 − β T A 1 − 1 β 0 0 A 1 ) .
令 b = a 11 − β T A 1 − 1 β ,同取行列式,可知 b > 0 . 又根据归纳假设,存在主对角元均为正的实 n − 1 阶上三角矩阵 L 1 ,使 A 1 = L 1 L 1 T . 因此,上式可表述为
( a 11 β β T A 1 ) = ( 1 0 − β T A 1 − 1 E n − 1 ) − 1 ( b 0 0 L 1 ) ( b 0 0 L 1 T ) ( 1 − A 1 − 1 β 0 E n − 1 ) − 1 .
令 L = ( 1 0 − β T A 1 − 1 E n − 1 ) − 1 ( b 0 0 L 1 ) ,则 L 是主对角元均为正的实 n 阶上三角矩阵,且 A = L L T .
方法2: 使用QR分解
存在可逆矩阵 B 使得 A = B T B
由QR分解 ,存在正交矩阵 Q 和主对角元全为正实数的上三角矩阵 R , 使得 B = QR ,于是
A = ( QR ) T ( QR ) = R T R
这就完成了证明
二阶旋转矩阵分解
任何一个二阶旋转矩阵可以分解为两个镜面反射矩阵的乘积
任何一个二维旋转都可以由两次连续的镜面反射得到。几何上,一个向量先关于直线 L 1 反射,再关于直线 L 2 反射,其效果等同于一个旋转,旋转角度是 L 1 与 L 2 夹角的两倍。代数上,我们可以构造出来。一个关于 x 轴的反射矩阵是
H 1 = ( 1 0 0 − 1 )
一个关于与 x 轴夹角为 ϕ 的直线的反射矩阵是
H 2 = ( cos ( 2 ϕ ) sin ( 2 ϕ ) sin ( 2 ϕ ) − cos ( 2 ϕ ) )
它们的乘积是:
H 2 H 1 = ( cos ( 2 ϕ ) sin ( 2 ϕ ) sin ( 2 ϕ ) − cos ( 2 ϕ ) ) ( 1 0 0 − 1 ) = ( cos ( 2 ϕ ) sin ( 2 ϕ ) − sin ( 2 ϕ ) cos ( 2 ϕ ) ) = R ( 2 ϕ )
因此,任何一个旋转角为 θ = 2 ϕ 的旋转矩阵 R ( θ ) 都可以分解为两个反射矩阵的乘积
Cartan-Dieudonné 定理
任一 n 阶正交矩阵 A 都可表示成不超过 n 个 n 阶镜面反射矩阵之积
方法1: 使用归纳法.
当n = 1 时,结论显然. 假设n − 1 时结论成立,对于n 阶正交矩阵A ,设 η 是A 的第一列
(因而是单位向量), e = ( 1 , 0 , ⋯ , 0 , 0 ) T ,由12. 内积空间与辛空间的投影 > 垂直平行投影 中的镜面反射结论,存在 n 阶镜面反射矩阵 B 0 ,使得 B 0 η = e ,故
B 0 A = ( 1 0 α T A 1 ) .
注意到 B 0 A 是正交矩阵,从而 α = 0 ,且A 1 是 n − 1 阶正交矩阵.根据归纳假设,存在至多 n − 1 个 n − 1 阶镜面反射矩阵 B 1 , B 2 , ⋯ , B n − 1 ,使得 A 1 = B 1 B n − 1 ⋯ B 2 .因此,有
A = B 0 ( 1 B 1 ) ( 1 B 2 ) ⋯ ( 1 B n − 1 ) .
易知,上式右边的每一个因子都是 n 阶镜面反射矩阵,且个数不超过 n ,命题得证
方法2: 使用正交矩阵标准型
由正规矩阵标准型 ,任何一个 n 维正交矩阵 A 都可以通过正交相似变换化为分块对角矩阵,即存在一个正交矩阵 P ,使得:
D = P T A P
其中 D 的形式如下:
D = I k − I m R ( θ 1 ) ⋱ R ( θ l )
R ( θ j ) 是 2 × 2 的旋转矩阵:
R ( θ j ) = ( cos θ j sin θ j − sin θ j cos θ j ) , 其中 sin θ j = 0 。
矩阵的维数满足 k + m + 2 l = n
现在我们将 D 分解为镜面反射矩阵的乘积,一方面,− I m 可以分解为 m 个镜面反射矩阵(主对角线元只有1个-1,1,再用 1 作为其他主对角元补成 n 阶镜面反射矩阵),另一方面,由二阶旋转矩阵分解 ,每个 R ( θ j ) 可分解为两个二阶镜面反射矩阵乘积,然后再令主对角元的其他位置为 1 就是一个 n 阶镜面反射矩阵。因此我们得到了 m + 2 l = n − k 个镜面反射矩阵的乘积,由于 k ≥ 0 ,因此 D 至多可分解为 n 个镜面反射矩阵乘积
对 P 进行分块,对每个镜面反射矩阵 D i ,P i T D i P 仍是一个镜面反射矩阵(特征值仍然是 − 1 和 n − 1 个 1 ),因此就完成了证明
谱分解
设 V 是有限维内积空间,φ 是 V 上的线性算子,当 V 是酉空间时 φ 为正规算子;当 V 是欧氏空间时 φ 为自伴随算子。λ 1 , λ 2 , ⋯ , λ k 是 φ 全体不同的特征值,W i 为 φ 属于 λ i 的特征子空间,则 V 是 W i ( i = 1 , 2 , ⋯ , k ) 的正交直和。这时若设 E i 是 V 到 W i 上的正交投影,则 φ 有下列分解式:
φ = λ 1 E 1 + λ 2 E 2 + ⋯ + λ k E k .
证明: 由于正规矩阵不同特征值对应的特征子空间相互正交,故
V = W 1 ⊥ W 2 ⊥ ⋯ ⊥ W k .
又因为 E i 是 V → W i 的正交投影,故
I = E 1 + E 2 + ⋯ + E k ,
注意 φ E i = λ i E i ,于是
φ = φ E 1 + φ E 2 + ⋯ + φ E k = λ 1 E 1 + λ 2 E 2 + ⋯ + λ k E k .
总结
不难发现半正定矩阵的k次方根,极分解,奇异值分解,QR分解,Cholesky分解之间存在着能够相互证明的路径,最后每个分解用一句话总结一下就是
满秩分解 :将矩阵分解为一个列满秩矩阵与一个行满秩矩阵的乘积
Fitting分解 :将线性空间分解为幂零变换与可逆变换的不变子空间直和
Voss分解 :任意实矩阵可表示为两个实对称矩阵的乘积,且其中之一可逆
Jordan-Chevalley分解 :矩阵唯一分解为可对角化部分与幂零部分的和,且二者可交换
奇异值分解 :通过正交(酉)变换将矩阵化为非负奇异值构成的对角分块矩阵
极分解 :矩阵可分解为正交(酉)矩阵与半正定矩阵的乘积
QR分解 :可逆矩阵可唯一分解为正交矩阵与主对角元正的上三角矩阵的乘积,源于Gram-Schmidt正交化
LU分解 :若 A 的顺序主子式全不为0(或 a ii = 0 ),则其可以分解为一个主对角元为1的上三角矩阵和下三角矩阵的乘积
半正定矩阵的k次方根 :半正定矩阵可表示为另一个半正定矩阵的k次方
Cholesky分解 :正定对称矩阵可唯一分解为下三角矩阵与其转置的乘积
Cartan-Dieudonné定理 :正交矩阵可表示为有限个镜面反射的乘积
谱分解 :正规算子可表示为特征值与其对应正交投影算子的线性组合