矩阵的标准型

相抵标准型

相抵标准型

对于 $m \times n$ 阶矩阵 $A$ ，若 $r (A) = r$ ，则存在 $m$ 阶可逆矩阵 $P$ 和 $n$ 阶可逆矩阵 $Q$ 使得
$P A Q = (I_{r} O O O)$

有理标准型

Frobenius

$F = 00 ⋮ 0 - a_{r} 10 ⋮ 0 - a_{r - 1} 01 ⋮ 0 - a_{r - 2} \dots \dots ⋱ \dots \dots 00 ⋮ 1 - a_{1}$

$F$ 的行列式因子为 $1, ..., 1, f (λ)$

f (λ) = λ^{r} + a_{1} λ^{r - 1} + ... + a_{r}

有理标准型

设 $A$ 是域 $K$ 上的 $n$ 阶方阵， $A$ 的不变因子组为
$1, \dots, 1, d_{1} (λ), \dots, d_{k} (λ),$

其中 $de g d_{i} (λ) = m_{i} \geq 1$ ，则 $A$ 相似于下列分块对角矩阵

F = F_{1} F_{2} ⋱ F_{k}

其中 $F_{i}$ 的阶等于 $m_{i}$ ， $F_{i}$ 的最后一行由 $d_{i} (λ)$ 的系数（除首项系数之外）的负值组成。

例

设 6 阶矩阵 $A$ 的不变因子为
$1, 1, 1, λ - 1, (λ - 1)^{2}, (λ - 1)^{2} (λ + 1),$

则 $A$ 的有理标准型为

$1 0 - 1 12 00 - 1 101011$

Jordan标准型

Jordan块

$r$ 阶矩阵
$J = λ_{0} 1 λ_{0} 1 ⋱ ⋱ λ_{0} 1 λ_{0}$

$J$ 的初等因子组为 $(λ - λ_{0})^{r}$

Jordan标准型

设 $A$ 是复数域上的矩阵且 $A$ 的初等因子组为

(λ - λ_{1})^{r_{1}}, (λ - λ_{2})^{r_{2}}, \dots, (λ - λ_{k})^{r_{k}},

则 $A$ 相似于分块对角阵：

J = J_{1} J_{2} ⋱ J_{k},

其中 $J_{i}$ 为 $r_{i}$ 阶矩阵，且

J_{i} = λ_{i} 1 λ_{i} 1 ⋱ ⋱ λ_{i} 1 λ_{i} .

广义Jordan标准型

对于一多项式，我们用 $F (P (λ))$ 表示 $P (λ)$ 的Frobenius块：

F (P (λ)) = 00 ⋮ 0 - a_{m} 10 ⋮ 0 - a_{m - 1} 01 ⋮ 0 - a_{m - 2} \dots \dots \dots \dots 00 ⋮ 1 - a_{1},

用 $C_{m}$ 表示第 $(m, 1)$ 元素为 $1$ ，其他元素全为零的 $m$ 阶矩阵：

C_{m} = 00 ⋮ 01 00 ⋮ 00 00 ⋮ 00 \dots \dots \dots \dots 00 ⋮ 00 .

设 $A$ 是 $K$ 上的 $n$ 阶矩阵，其不变因子组为 $1, \dots, 1, d_{1} (λ), \dots, d_{k} (λ)$ ，其中 $d_{i} (λ)$ 是非常数首一多项式， $d_{i} (λ) ∣ d_{i + 1} (λ)$ （ $1 ⩽ i ⩽ k - 1$ ）。根据定义，所有不变因子 $d_{i} (λ)$ 的准素因子全体就是 $A$ 的初等因子组，因此 $A$ 的初等因子必为 $P (λ)^{e}$ 的形状，其中 $P (λ)$ 是 $K$ 上的首一不可约多项式， $e ⩾ 1$ 。

设 $P (λ) = λ^{m} + a_{1} λ^{m - 1} + \dots + a_{m - 1} λ + a_{m}$ 是 $K$ 上的首一不可约多项式， $e$ 是正整数，则下列矩阵的不变因子组均为 $1, \dots, 1, P (λ)^{e}$ ：

$J_{e} (P (λ)) = F (P (λ)) O ⋮ O O I_{m} F (P (λ)) ⋮ O O O I_{m} ⋮ O O \dots \dots \dots \dots O O ⋮ F (P (λ)) O O O ⋮ I_{m} F (P (λ));$
$J_{e} (P (λ)) = F (P (λ)) O ⋮ O O C_{m} F (P (λ)) ⋮ O O O C_{m} ⋮ O O \dots \dots \dots \dots O O ⋮ F (P (λ)) O O O ⋮ C_{m} F (P (λ)) .$

一般数域上的Jordan标准型

设 $A$ 是 $K$ 上的 $n$ 阶矩阵, 它在 $K$ 上的初等因子组为 $P_{1} (λ)^{e_{1}}, P_{2} (λ)^{e_{2}}, \dots, P_{t} (λ)^{e_{t}}$ , 其中 $P_{i} (λ)$ 是 $K$ 上的首一不可约多项式, $e_{i} ⩾ 1$ , $1 ⩽ i ⩽ t$ , $A$ 在 $K$ 上相似于下列分块对角矩阵:
(1) $J = diag {J_{e_{1}} (P_{1} (λ)), J_{e_{2}} (P_{2} (λ)), \dots, J_{e_{t}} (P_{t} (λ))}$ ;
(2) $J = diag {J_{e_{1}} (P_{1} (λ)), J_{e_{2}} (P_{2} (λ)), \dots, J_{e_{t}} (P_{t} (λ))}$ .

实数域上的Jordan标准型

设 $A$ 是实数域上的 $n$ 阶矩阵，证明 $A$ 在实数域上相似于下列分块对角矩阵：
(1) $J = diag {J_{r_{1}} (λ_{1}), \dots, J_{r_{k}} (λ_{k}), J_{s_{1}} (a_{1}, b_{1}), \dots, J_{s_{l}} (a_{l}, b_{l})}$ ；
(2) $J = diag {J_{r_{1}} (λ_{1}), \dots, J_{r_{k}} (λ_{k}), J_{s_{1}} (a_{1}, b_{1}), \dots, J_{s_{l}} (a_{l}, b_{l})}$ ，
其中 $λ_{1}, \dots, λ_{k}, a_{1}, b_{1}, \dots, a_{l}, b_{l}$ 都是实数， $b_{1}, \dots, b_{l}$ 都非零， $J_{r_{i}} (λ_{i})$ 表示以 $λ_{i}$ 为特征值的通常意义下的 Jordan 块， $R_{j} = (a_{j} - b_{j} b_{j} a_{j})$ ， $C_{2} = (0100)$ ，且

J_{s_{j}} (a_{j}, b_{j}) = R_{j} I_{2} R_{j} I_{2} ⋱ ⋱ R_{j} I_{2} R_{j}, J_{s_{j}} (a_{j}, b_{j}) = R_{j} C_{2} R_{j} C_{2} ⋱ ⋱ R_{j} C_{2} R_{j} .

例

当5阶矩阵 $A$ 的最小多项式为 $(λ - 3) (λ^{2} + 1)^{2}$ 时，写出其在 $R$ 上的Jordan标准型

$J_{2} (0, 1)$ 是对应不可约二次多项式 $x^{2} + 1$ 的广义Jordan块，其尺寸为 $2 \cdot 2 = 4$ ：

J_{2} (0, 1) = (R 0 I_{2} R), R = (0 - 1 10), I_{2} = (1001) .

因此显式的 $5 \times 5$ 形式为

J = 30000 00 - 1 00 01000 0100 - 1 00110 = diag (3, J_{2} (0, 1)) .

例

$A = a b 0000 - b a 0000 01 a b 00 00 - b a 00 0001 a b 0000 - b a,$
求 $A$ 在 $R$ 上的不变因子组

此时对应了实数域上广义Jordan标准型的第二种类型，行列式因子组和不变因子组均为 $1, ..., 1, ((λ - a)^{2} + b^{2})^{3}$ . 如果在复数域上求Jordan标准型，那就是 $diag {J_{3} (z_{0}), J_{3} (\overset{z_{0}}{ˉ})}$

广义Jordan标准型可以处理一般数域上的问题，相比几何做法，设标准型则显得更加直观。下面的例子在复数域上用Jordan标准型很好证明，但一般数域的情形下就变得困难

例

设 $V$ 是数域 $K$ 上的 $n$ 维线性空间， $φ$ 是 $V$ 上的线性变换. 证明： $φ$ 的极小多项式在 $K$ 上无重因式的充分必要条件是对 $V$ 的任一 $φ$ -不变子空间 $U$ ,均存在 $φ$ -不变子空间 $W$ ,使得 $V = U \oplus W .$

首先证明如下引理

引理

充分性的条件对 $V$ 的任一 $φ$ -不变子空间 $U$ 也满足

证明: 任取 $U$ 的 $φ$ -不变子空间 $U_{1}$ ,则 $U_{1}$ 也是 $V$ 的 $φ$ -不变子空间，因此存在 $φ$ -不变子空间 $W$ ,使得
$V = U_{1} \oplus W$ .令 $W_{1} = U \cap W$ ,由于 $U_{1} \subseteq U$ ,故

U = U \cap V = U \cap (U_{1} + W) = U_{1} + U \cap W = U_{1} + W_{1} = U_{1} \oplus W_{1}

充分性:
用反证法, 若 $m (λ)$ 有重因式, 那么至少有一个初等因子形如 $P (λ)^{r}$ , 其中 $P (λ)$ 是数域 $K$ 上的 $d$ 次不可约多项式, $r \geq 2$ . 由引理可知, $V$ 的任一 $φ$ -不变子空间都满足性质 $P$ . 因此为了方便叙述, 我们不妨设 $V$ 就是初等因子 $P (λ)^{r}$ 的第一类广义 Jordan 块对应的子空间, 或者等价的, $φ$ 只有一个初等因子 $P (λ)^{r}$ . 于是存在 $V$ 的一组基 ${e_{1, 1}, e_{1, 2}, \dots, e_{1, d}; \dots; e_{r, 1}, e_{r, 2}, \dots, e_{r, d}}$ , 使 $φ$ 在这组基下的表示矩阵为第一类广义 Jordan 块

J = J_{r} (P (λ)) = F (P (λ)) I F (P (λ)) I ⋱ ⋱ F (P (λ)) I F (P (λ))

其中 $F = F (P (λ))$ 是对应于 $P (λ)$ 的有理块, $I$ 是单位阵. 令 $U = L (e_{1, 1}, e_{1, 2}, \dots, e_{1, d}; \dots; e_{r - 1, 1}, e_{r - 1, 2}, \dots, e_{r - 1, d})$ , 容易验证 $U$ 是 $φ$ -不变子空间, 于是存在 $φ$ -不变子空间 $W$ , 使得 $V = U \oplus W$ . 任取 $0 \neq = α \in W$ , 设 $α = \sum_{i = 1}^{r} \sum_{j = 1}^{d} c_{i, j} e_{i, j}$ , 则 $c_{r, 1}, c_{r, 2}, \dots, c_{r, d}$ 不全为零. 设 $x = (c_{1, 1}, c_{1, 2}, \dots, c_{1, d}; \dots; c_{r, 1}, c_{r, 2}, \dots, c_{r, d})^{'}$ 为 $α$ 对应的坐标向量, 则向量 $P (φ) (α)$ 对应的坐标向量为

P (J) x = 0 P^{'} (F) 0 P^{'} (F) ⋱ ⋱ 0 * P^{'} (F) 0 x .

注意到 $(P (λ), P^{'} (λ)) = 1$ , 故 $P^{'} (F)$ 是非异阵, 由此不难看出 $P (J) x \neq = 0$ 并且它的最后 $d$ 个分量全为零. 因此 $0 \neq = P (φ) (α) \in U \cap W$ , 矛盾.

必要性:
由假设可知 $φ$ 的初等因子都是 $K$ 上的不可约多项式, 设为 $P_{1} (λ), P_{2} (λ), \dots, P_{k} (λ)$ , 因此 $φ$ 的广义 Jordan 标准型为 $J = diag {F (P_{1} (λ)), F (P_{2} (λ)), \dots, F (P_{k} (λ))}$ . 设广义 Jordan 块 $F (P_{i} (λ))$ 对应的子空间为 $V_{i}$ , 则 $V = V_{1} \oplus V_{2} \oplus \dots \oplus V_{k}$ .
我们对 $dim U$ 进行反向归纳. 若 $dim U = n$ , 即 $U = V$ , 结论显然成立.
设 $dim U > m$ 时, 结论成立,
现考虑 $dim U = m$ 的情形. 首先断言: 若 $U \cap V_{i} \neq = 0$ , 则 $V_{i} \subseteq U$ . 事实上, 注意到 $φ ∣_{V_{i}}$ 的特征多项式为 $P_{i} (λ)$ , 这是 $K$ 上的不可约多项式, 若设 $φ$ 在 $U \cap V_{i}$ 上限制的特征多项式为 $f_{i} (λ)$ , 则容易验证 $f_{i} (λ) ∣ P_{i} (λ)$ , 从而只能是 $f_{i} (λ) = P_{i} (λ)$ , 于是 $U \cap V_{i} = V_{i}$ , 即 $V_{i} \subseteq U$ .
下面依次考虑 $U$ 与 $V_{1}, V_{2}, \dots, V_{k}$ 之间的关系. 若 $U \cap V_{1} = 0$ , 则令 $U^{'} = U \oplus V_{1}$ . 注意到 $dim U^{'} > m$ , 从而由归纳假设存在 $φ$ -不变子空间 $W^{'}$ , 使得 $V = U^{'} \oplus W^{'} = U \oplus V_{1} \oplus W^{'}$ , 再令 $W = V_{1} \oplus W^{'}$ 即得结论. 若 $U \cap V_{1} \neq = 0$ , 则 $V_{1} \subseteq U$ , 那么接下去考虑 $U$ 与 $V_{2}$ 之间的关系即可. 一直这样做下去, 最后可知结论成立.

下面来看一个用实数域上的Jordan标准型解决问题的例子

正规矩阵标准型

实数域上的标准型

设 $T$ 是 $n$ 维欧氏空间 $V$ 的正规变换， $T$ 在 $V$ 的标准正交基 $η_{1}, η_{2}, \dots, η_{n}$ 下的矩阵为 $A$ . 若 $T$ 的特征值为 $λ_{i} \in R (1 ⩽ i ⩽ r)$ ， $a_{k} \pm i b_{k} (b_{k} \neq = 0, 1 ⩽ k ⩽ s)$ ，则存在正交矩阵 $P$ ，使得
$P^{- 1} A P = diag (λ_{1}, λ_{2}, \dots, λ_{r}, (a_{1} b_{1} - b_{1} a_{1}), \dots, (a_{s} b_{s} - b_{s} a_{s})) . (1)$

若为复数域上的标准型，只留下 $λ_{i}$ 即可，也就是说正规矩阵在复数域上可正交对角化
**由于正交矩阵，酉矩阵，对称矩阵，反对称矩阵，Hermitian矩阵，反Hermitian矩阵均为正规矩阵，故由正规矩阵的标准型可直接写出这些矩阵的标准型

实对称矩阵：存在实正交矩阵使得

Q^{T} A Q = diag (μ_{1}, \dots, μ_{n}), μ_{i} \in R .

Hermitian 矩阵：存在酉矩阵使得

U^{*} A U = diag (μ_{1}, \dots, μ_{n}), μ_{i} \in R .

对于反对称矩阵，存在正交矩阵使得

Q^{T} A Q = diag (J (μ_{1}), \dots, J (μ_{k}), 0, \dots, 0),

每个

J (μ) = (0 μ - μ 0), μ > 0.

如果阶数为奇数，则一定有0分块

矩阵的分解

一般矩阵分解

满秩分解

满秩分解

如果一个 $m \times n$ 矩阵 $A$ 的秩为 $r$ ,那么有 $m \times r$ 的列满秩矩阵 $B$ 和 $r \times n$ 的行满秩矩阵 $C$ ,使得
$A = B C$

Fitting分解

Fitting分解

设 $A$ 为 $n$ 阶复方阵. 求证: 如果 $A$ 不可逆也不是幂零矩阵, 那么存在 $n$ 阶可逆矩阵 $P$ , 使得 $P^{- 1} A P = (B O O C)$ , 其中 $B$ 是可逆矩阵, $C$ 是幂零矩阵, 即存在正整数 $m$ 使得 $C^{m} = O$ .

对于复数域上的情形直接设Jordan标准型即可，但如果是一般的数域，Jordan标准型的方法就不管用了，一个好的办法是将其转换为几何语言，用映射的方式去解决

Fitting分解

设 $V$ 是数域 $K$ 上的 $n$ 维线性空间 $, φ$ 是 $V$ 上的线性变换.证明：存在直和分解

V = V_{1} \oplus V_{2},

其中 $V_{1}, V_{2}$ 是 $φ$ -不变子空间，使得 $φ ∣_{V_{1}}$ 是幂零线性变换 $, φ ∣_{V_{2}}$ 是可逆线性变换.

设 $φ$ 的特征多项式

f (λ) =∣ λ I_{v} - φ ∣= λ^{r} (λ^{n - r} + c_{1} λ^{n - r - 1} + \dots + c_{n - r}),

其中 $c_{n - r} \neq = 0 (0 ⩽ r ⩽ n) .$ 显然，多项式

f_{1} (λ) = λ^{r},

f_{2} (λ) = λ^{n - r} + c_{1} λ^{n - r - 1} + \dots + c_{n - r}

互素，于是存在直和分解

V = V_{1} \oplus V_{2},

其中

V_{i} = Ker f_{i} (φ) (i = 1, 2) .

$φ ∣_{V_{1}}$ 的特征多项式是 $λ^{r}$ ,所以它是幂零线性变换. $φ ∣_{V_{2}}$ 的特征多项式是 $λ^{n} - r + c_{1} λ^{n - r - 1} + \dots + c_{n - r}$ ,注意到 $c_{n - r} \neq = 0$ ,所以它是可逆线性变换.

根据上面的结论，不难得到另一种形式的分解

Fitting分解

$V = Ker φ^{r} \oplus Im φ^{r}$

证明: 根据上面的结论， $V_{1} = Ker φ^{r}$ ，现在证明 $Im φ^{r} \subseteq V_{2}$
设 $u = φ^{r} (v), v \in V$ ，则 $u \in Im φ^{r}$ ， $φ$ 的特征多项式

f (λ) =∣ λ I_{v} - φ ∣= λ^{r} (λ^{n - r} + c_{1} λ^{n - r - 1} + \dots + c_{n - r}) = 0

于是

(φ^{n - r} + c_{1} φ^{n - r - 1} + \dots + c_{n - r}) u = (φ^{n - r} + c_{1} φ^{n - r - 1} + \dots + c_{n - r}) φ^{r} (v) = f (φ) v = 0

于是就证明了 $Im φ^{r} \subseteq V_{2}$ ，再由

dim (V) = dim (Ker φ^{r}) + dim (Im φ^{r}) = dim V_{1} + dim V_{2}

就能得到 $Im φ^{r} = V_{2}$ ，因此就完成了证明

Voss分解

Voss分解

任何一个矩阵均可表示为两个实对称矩阵的乘积，并且其中至少有一个矩阵可逆

方法1: 拆成共轭的Jordan块处理
证明: 设 $A$ 是 $n$ 阶实方阵, 其 Jordan 标准形为 $J = diag (J_{1}, J_{2}, \dots, J_{s})$ , 其中 $J_{i}$ 是 $A$ 的属于特征值 $λ_{i}$ 的 $n_{i}$ 阶 Jordan 块( $i = 1, 2, \dots, s$ ), $\sum_{i = 1}^{s} n_{i} = n$ . 则存在 $n$ 阶可逆复矩阵 $P$ 使得 $P^{- 1} A P = J$ . 对每个 Jordan 块 $J_{i}$ , 有

J_{i} = λ_{i} 1 λ_{i} ⋱ ⋱ 1 λ_{i} = 1 λ_{i} \dots \dots 1 λ_{i} λ_{i} 1 \dots 11 = C_{i} D_{i}, (1)

所以 $J = C D$ , 其中 $C = diag (C_{1}, C_{2}, \dots, C_{s})$ 是对称矩阵, $D = diag (D_{1}, D_{2}, \dots, D_{s})$ 是可逆实对称矩阵. 故

A = P J P^{- 1} = (P C P^{T}) [(P^{T})^{- 1} D P^{- 1}] = G H,

其中 $G = P C P^{T}, H = (P^{T})^{- 1} D P^{- 1}$ 都是对称矩阵, 并且 $H$ 是可逆矩阵.

现在, 由于 $A$ 为实矩阵, 其虚特征值(如果有的话)必成共轭对出现, 因此可根据 $A$ 的特征值将 $J$ 的对角子块重排, 而 $P$ 的列向量和 $D$ 的子块也作相应重排, 使得

P = (P_{(1)}, P_{(2)}, P_{(3)}), J = J_{(1)} J_{(2)} J_{(3)}, D = D_{(1)} D_{(2)} D_{(3)},

其中 $J_{(1)}$ 仅由 $A$ 的实特征值对应的 Jordan 块构成, $J_{(2)}$ 与 $J_{(3)}$ 的各个 Jordan 块分别对应 $A$ 的成共轭对的虚特征值, 其重数也对应相同, 所以 $J_{(3)} = \overset{ˉ}{J}_{(2)}$ , 从而有 $D_{(3)} = \overset{ˉ}{D}_{(2)}$ , 且 $P_{(3)} = \overset{ˉ}{P}_{(2)}$ .
比较 $A P = P J$ , 可得 $A P_{(1)} = P_{(1)} J_{(1)}$ , 因为 $A, J_{(1)}$ 都是实矩阵, 而 $P_{(1)}$ 的列向量是 $A$ 的根向量, 此时可都取实向量, 所以 $P_{(1)}$ 为实矩阵. 此外, 由于

H^{- 1} = P D^{- 1} P^{T} = P_{(1)} D_{(1)}^{- 1} P_{(1)}^{T} + [P_{(2)} D_{(2)}^{- 1} \overset{ˉ}{P}_{(2)}^{T} + \overset{ˉ}{P}_{(2)} \overset{ˉ}{D}_{(2)}^{- 1} P_{(2)}^{T}]

是两个实矩阵之和, 所以 $H^{- 1}$ 因而 $H$ 是实矩阵, 从而 $G = A H^{- 1}$ 也是实矩阵.
特别, 若 $A$ 只有实特征值, 则 $J_{(2)}$ 与 $J_{(3)}$ 不出现; 若 $A$ 没有实特征值, 则 $J_{(1)}$ 不出现. 此时, 只需在上述相应地方作适当修改即可, 结论成立.

方法2: 实数域上的Jordan标准型
证明: 任取 $n$ 阶实矩阵 $A$ , 记对应的实系数特征多项式为 $f (λ)$ , 根据实数域上的标准分解可作如下分解

f (λ) = a (λ - c_{1})^{l_{1}} \dots (λ - c_{p})^{l_{p}} [(λ - a_{1})^{2} + b_{1}^{2}]^{l_{p + 1}} \dots [(λ - a_{q})^{2} + b_{q}^{2}]^{l_{p + q}}

其中 $b_{1}, \dots, b_{q}$ 都不为零. 令二阶矩阵 $B_{i} = (a_{i} b_{i} - b_{i} a_{i}), C = (0100)$ , 则矩阵 $B_{i}$ 的特征多项式为 $(λ - a_{i})^{2} + b_{i}^{2}$ , 且 $2 k$ 阶实矩阵

B_{ik} = B_{i} C B_{i} C ⋱ ⋱ B_{i} C B_{i}

的最小多项式为特征多项式 $[(λ - a_{i})^{2} + b_{i}^{2}]^{k}$ . 此时由广义Jordan标准型，存在实矩阵

A_{1} = diag {J_{t_{1}}, \dots, J_{t_{s}}, B_{1 k_{1}}, \dots, B_{r k_{r}}}

相似于矩阵 $A$ , 其中 $J_{t_{i}}$ 是形如 $J_{k} (c_{i})$ 的若尔当块, $B_{i k_{i}}$ 是形如上面 $B_{ik}$ 的矩阵. 现在令 $H_{2 k}$ 为副对角线上元素都为 $1$ , 其余元素都为 $0$ 的 $2 k$ 阶矩阵, 则对称矩阵 $H_{2 k}$ 满足 $H_{2 k} = H_{2 k}^{- 1}$ , 可使 $B_{ik} H_{2 k}$ 为实对称矩阵 , 此时矩阵 $A_{1}$ 有分解

A_{1} = J_{t_{1}} H_{t_{1}} ⋱ J_{t_{s}} H_{t_{s}} B_{1 k_{1}} H_{2 k_{1}} ⋱ B_{r k_{r}} H_{2 k_{r}} H_{t_{1}} ⋱ H_{t_{s}} H_{2 k_{1}} ⋱ H_{2 k_{r}} = T_{1} T_{2}

这时 $T_{1}, T_{2}$ 为实对称矩阵. 因为存在实可逆矩阵 $P$ 满足

A = P A_{1} P^{- 1} = P T_{1} T_{2} P^{- 1} = (P T_{1} P^{'}) [(P^{- 1})^{'} T_{2} P^{- 1}]

其中 $P T_{1} P^{'}$ 与 $(P^{- 1})^{'} T_{2} P^{- 1}$ 为对称矩阵, 且后者可逆, 到此证毕!

Jordan-Chevalley分解

复数域上的Jordan-Chevalley 分解

设 $V$ 是复数域上的 $n$ 维线性空间, $A$ 是 $V$ 上的线性变换, 则
(1) 存在 $V$ 上唯一的线性变换 $B, N$ , 使得 $A = B + N$ , 且 $B N = N B$ , 其中 $B$ 是可对角化变换, $N$ 是幂零变换;
(2) 存在常数项为零的复多项式 $p (x), q (x)$ , 使得 $B = p (A), N = q (A)$ .

证明: 设线性变换 $A$ 的特征多项式为

f (λ) = (λ - λ_{1})^{n_{1}} (λ - λ_{2})^{n_{2}} \dots (λ - λ_{s})^{n_{s}},

其中 $λ_{1}, λ_{2}, \dots, λ_{s}$ 是 $A$ 的所有互不相同的特征值, $n_{1} + n_{2} + \dots + n_{s} = n$ .
根据中国剩余定理, 关于多项式 $p (x)$ 的同余方程组

⎩ ⎨ ⎧ p (x) \equiv λ_{1} p (x) \equiv λ_{2} \dots\dots\dots\dots p (x) \equiv λ_{s} p (x) \equiv 0 (mod (λ - λ_{1})^{n_{1}}), (mod (λ - λ_{2})^{n_{2}}), (mod (λ - λ_{s})^{n_{s}}), (mod (λ)),

有解 $p (x)$ . 令 $q (x) = x - p (x)$ , 则 $p (x), q (x)$ 的常数项显然都为 0. 这里, 若 0 是 $A$ 的特征值, 则去掉最后一个同余式.
令 $B = p (A), N = q (A) = A - p (A)$ , 则 $A = B + N$ . 且 $B N = N B$ . 下证 $B$ 是可对角化的. 为此, 考虑 $V$ 的根子空间分解:

V = W_{1} \oplus W_{2} \oplus \dots \oplus W_{s},

其中 $W_{i} = ker (A - λ_{i} I)^{n_{i}}, i = 1, 2, \dots, s$ . 而 $W_{i}$ 是 $A$ 的不变子空间. 易知, $A$ 限制在 $W_{i}$ 上的特征多项式为 $(λ - λ_{i})^{n_{i}}$ .
因为 $p (λ) - λ_{i}$ 能被 $(λ - λ_{i})^{n_{i}}$ 整除, 所以 $p (A) - λ_{i} I$ 是 $W_{i}$ 上的零变换, 即 $p (A) ∣_{W_{i}} = λ_{i} I ∣_{W_{i}}$ 是 $W_{i}$ 上的数乘变换. 因此, $p (A)$ 在 $V$ 上可对角化.
另一方面, $N ∣_{W_{i}} = (A - B) ∣_{W_{i}} = (A - p (A)) ∣_{W_{i}} = (A - λ_{i} I) ∣_{W_{i}}$ ，由 $W_{i}$ 的定义，因此 $N$ 在每个 $W_{i}$ 上都是幂零的, 从而 $N$ 是 $V$ 上的幂零变换.

最后, 我们证明分解是唯一的. 设 $A = B^{'} + N^{'}$ , 是满足条件的另一个分解, 则

B - B^{'} = N^{'} - N .

注意到 $B^{'}$ 与 $A$ 可交换, 因而与 $B$ 可交换. 所以 $B, B^{'}$ 可同时对角化(因为两个可交换并且可对角化的变换可同时对角化). 所以 $N^{'} - N$ 可对角化，另外, $N, N^{'}$ 可交换, 所以 $N^{'} - N$ 是幂零的. 容易证明, 可对角化的幂零变换必为零变换, 这就证明了 $B = B^{'}$ , 从而 $N = N^{'}$ .

接下来我们证明一般数域上的Jordan-Chevalley分解

在复数域上我们通过将特征多项式分解为一次因式来进行构造，但一般数域下可能并不能分解的那么“干净”，此时就需要一般数域上的标准型进行构造

一般数域上的Jordan-Chevalley分解

设 $A$ 是数域 $K$ 上的 $n$ 阶矩阵，证明存在 $K$ 上的 $n$ 阶矩阵 $B, C$ ,使得 $A = B + C$ ,且满足
(1) $B$ 在复数域上可对角化；(2) $C$ 是幂零矩阵；(3) $B C = C B$ ,
并且满足上述条件的分解一定是唯一的.

证明: 设 $A$ 在 $K$ 上的初等因子组为 $P_{1} (λ)^{e_{1}}, P_{2} (λ)^{e_{2}}, \dots, P_{t} (λ)^{e_{t}}$ ，其中
$P_{i} (λ)$ 是 $K$ 上的首一不可约多项式， $e_{i} \geq 1$ ， $1 \leq i \leq t$ . 由广义Jordan标准型，存在 $K$ 上的可逆矩阵 $P$ ，使得

P^{- 1} A P = J = diag {J_{e_{1}} (P_{1} (λ)), J_{e_{2}} (P_{2} (λ)), \dots, J_{e_{t}} (P_{t} (λ))} .

我们先对广义Jordan块 $J_{e_{i}} (P_{i} (λ))$ 来证明结论，为方便起见，记 $F_{i} = F (P_{i} (λ))$ 。
由于 $P_{i} (λ)$ 在 $K$ 上不可约，故 $(P_{i} (λ), P_{i}^{'} (λ)) = 1$ ，从而 $P_{i} (λ)$ 在复数域上无重根，于是 $F_{i}$ 在复数域上可对角化，令

M_{i} = F_{i} O ⋮ O O O F_{i} ⋮ O O O O ⋮ O O \dots \dots \dots \dots O O ⋮ F_{i} O O O ⋮ O F_{i}, N_{i} = O O ⋮ O O I O ⋮ O O O I ⋮ O O \dots \dots \dots \dots O O ⋮ O O O O ⋮ I O .

则容易验证

J_{e_{i}} (P_{i} (λ)) = M_{i} + N_{i}, M_{i} N_{i} = N_{i} M_{i} .

$M_{i}$ 可复对角化, $N_{i}$ 幂零，再令

M = diag {M_{1}, \dots, M_{t}}, N = diag {N_{1}, \dots, N_{t}},

则

J = M + N, M N = N M .

$M$ 可复对角化, $N$ 幂零，最后令

B = P M P^{- 1}, C = P N P^{- 1},

则 $B, C$ 是 $K$ 上的矩阵，并且

A = B + C, B C = C B .

从而 $B$ 可复对角化, $C$ 幂零，至于唯一性的证明，可以先将 $A, B, C$ 看作是复数域上的矩阵，然后由于任何数域都可以嵌入复数域，因此就能得到在 $K$ 上的唯一性

奇异值分解

奇异值分解

设 $A$ 是 $m \times n$ 实矩阵, $rank A = r$ , 则存在 $m$ 阶正交矩阵 $U$ 与 $n$ 阶正交矩阵 $V$ , 使得 $A = U (Σ O O O) V^{T}$ , 其中 $Σ = diag (σ_{1}, σ_{2}, \dots, σ_{r})$ , 而 $σ_{1} \geq σ_{2} \geq \dots \geq σ_{r} > 0$ 。

证明: 设 $λ_{1} \geq λ_{2} \geq \dots \geq λ_{r} > 0$ 是半正定矩阵 $A A^{T}$ 的非零特征值(显然为实数), $u_{1}, u_{2}, \dots, u_{r}$ 是对应的标准正交化特征向量, 则 $A A^{T} u_{j} = λ_{j} u_{j}, j = 1, 2, \dots, r$ 。记 $v_{j} = \frac{1}{σ _{j}} A^{T} u_{j}$ , 其中 $σ_{j} = λ_{j}, j = 1, 2, \dots, r$ , 可以验证: $v_{1}, v_{2}, \dots, v_{r}$ 是 $A^{T} A$ 的属于特征值 $λ_{1}, λ_{2}, \dots, λ_{r}$ 的标准正交化特征向量。

又设 $u_{r + 1}, \dots, u_{m}$ 是 $A A^{T}$ 的属于特征值 0 的标准正交化特征向量, $v_{r + 1}, \dots, v_{n}$ 是 $A^{T} A$ 的属于特征值 0 的标准正交化特征向量, 令

U = (u_{1}, \dots, u_{r}, u_{r + 1}, \dots, u_{m})

V = (v_{1}, \dots, v_{r}, v_{r + 1}, \dots, v_{n})

则 $U$ 与 $V$ 分别是 $m$ 阶和 $n$ 阶正交矩阵. 注意到 $u_{j}^{T} A = 0$ , $j = r + 1, \dots, m$ , 所以

A = U U^{T} A = (u_{1} u_{1}^{T} + u_{2} u_{2}^{T} + \dots + u_{m} u_{m}^{T}) A

= σ_{1} u_{1} v_{1}^{T} + σ_{2} u_{2} v_{2}^{T} + \dots + σ_{r} u_{r} v_{r}^{T}

= U (Σ O O O) V^{T}

复数域上的结论同理可证存在酉矩阵 $U, V$ 满足条件

下面是奇异值分解的一个应用

(2025 中国科学技术大学)

$A$ 为 $n$ 阶实矩阵, 证明: 若存在实矩阵 $P$ , 使得 $A^{T} = A P$ , 则存在正交
矩阵 $Q$ , 使得 $Q^{- 1} A Q$ 形如

(B O O O)

其中 $B$ 为可逆矩阵.

证明: 设 $A$ 的奇异值分解为 $A = U Σ V^{T}$ ，其中 $U = (u_{1}, ..., u_{r}, ..., u_{n}), V = (v_{1}, ..., v_{r}, ..., v_{n}), Σ = (Σ_{r} O O O)$
要证明原命题，即证明存在正交矩阵 $Q$ ，使得

U (Σ_{r} O O O) V^{T} = Q (B O O O) Q^{T}

因此如果能将 $U$ 表示为 $V$ 和另一个矩阵的乘积，便可以得到上面的式子，记
$U_{1} = {u_{1}, ..., u_{r}}, V_{1} = {v_{1}, ..., v_{r}}, U_{2} = {u_{r + 1}, ..., u_{n}}, V_{2} = {v_{r + 1}, ..., v_{n}}$
由奇异值分解的几何意义， $U_{1}$ 是 $Col (A)$ 的一组标准正交基， $V_{1}$ 是 $Row (A)$ 的一组标准正交基， $U_{2}$ 是 $ker (A^{T})$ 的一组标准正交基， $V_{2}$ 是 $ker (A)$ 的一组标准正交基
由于 $A^{T} = A P$ ，这说明 $Col (A) = Row (A)$ ，又因为 $ker (A) = Row (A)^{⊥}$ ， $ker (A^{T}) = Col (A)^{⊥}$ ，因此 $ker (A) = ker (A^{T})$ ，于是存在正交矩阵 $P_{1}, P_{2}$ 使得

U_{1} = V_{1} P_{1}, U_{2} = V_{2} P_{2}

代入 $A$ 的奇异值分解就有

A = U (Σ_{r} O O O) V^{T} = (U_{1}, U_{2}) (Σ_{r} O O O) (V_{1}^{T} V_{2}^{T}) = (V_{1}, V_{2}) (P_{1} O O P_{2}) (Σ_{r} O O O) (V_{1}^{T} V_{2}^{T}) = (V_{1}, V_{2}) (P_{1} Σ_{r} O O O) (V_{1}^{T} V_{2}^{T})

此时 $Q = (V_{1}, V_{2}) = V, B = P_{1} Σ_{r}$ ，于是我们就完成了证明

极分解

极分解

$n$ 阶实(复)矩阵 $A$ 可分解如下
$A = QS = S_{1} Q$
其中 $Q$ 是正交矩阵(酉矩阵)， $S, S_{1}$ 是半正定实对称矩阵(Hermite矩阵)

方法1: 若 $A$ 可逆，因为 $A$ 为实矩阵，所以 $A A^{T}$ 为实对称矩阵.

x^{T} (A A^{T}) x = (A^{T} x)^{T} (A^{T} x) \geq 0.

所以 $A A^{T}$ 是正定矩阵. 由半正定矩阵的k次方根，存在正定对称矩阵 $P$ ,使 $A A^{T} = P^{2} .$ 取 $U = P (A^{T})^{- 1}$ ,则 $A = P U .$ 容易验证： $U^{T} U = E$ ,即 $U$ 是正交矩阵。

方法2: 利用奇异值分解

A = U (Σ O O O) V^{T} = U V^{T} (V (Σ O O O) V^{T}) := QS

另一个方向同理可得，反向也能用极分解推出奇异值分解

QR分解

QR分解

设 $A$ 是 $n$ 阶实可逆矩阵. 存在正交矩阵 $Q$ 和主对角元全为正实数的上三角矩阵 $R$ , 使得 $A = QR$ , 并且这个表达式是唯一的.

方法1:
证明: 存在性. 把 $A$ 按列分块为 $A = (α_{1}, α_{2}, \dots, α_{n})$ , 由于 $det A \neq = 0$ , 所以向量组 $α_{1}, α_{2}, \dots, α_{n}$ 线性无关. 根据 Schmidt 正交化方法, 可得到与 $α_{1}, α_{2}, \dots, α_{n}$ 等价的正交向量组 $β_{1}, β_{2}, \dots, β_{n}$ , 即

β_{1} β_{2} β_{n} = α_{1}, = α_{2} - \frac{( α _{2} , β _{1} )}{( β _{1} , β _{1} )} β_{1}, \dots = α_{n} - i = 1 \sum n - 1 \frac{( α _{n} , β _{i} )}{( β _{i} , β _{i} )} β_{i} .

再单位化, 得 $η_{j} = \frac{1}{∣ β _{j} ∣} β_{j}, j = 1, 2, \dots, n$ . 因此 $η_{1}, η_{2}, \dots, η_{n}$ 是标准正交向量组, 且

α_{1} α_{2} α_{n} = β_{1} = ∣ β_{1} ∣ η_{1}, = \frac{( α _{2} , β _{1} )}{( β _{1} , β _{1} )} β_{1} + β_{2} = \frac{( α _{2} , β _{1} )}{∣ β _{1} ∣} η_{1} + ∣ β_{2} ∣ η_{2}, \dots = i = 1 \sum n - 1 \frac{( α _{n} , β _{i} )}{( β _{i} , β _{i} )} β_{i} + β_{n} = i = 1 \sum n - 1 \frac{( α _{n} , β _{i} )}{∣ β _{i} ∣} η_{i} + ∣ β_{n} ∣ η_{n} .

令 $t_{j j} = ∣ β_{j} ∣, j = 1, 2, \dots, n; t_{ij} = \frac{( α _{j} , β _{i} )}{∣ β _{i} ∣}, i = 2, 3, \dots, n; j = 1, 2, \dots, i - 1$ , 则

A = (α_{1}, α_{2}, \dots, α_{n}) = (η_{1}, η_{2}, \dots, η_{n}) t_{11} 0 ⋮ 0 t_{12} t_{22} ⋮ 0 \dots \dots \dots t_{1 n} t_{2 n} ⋮ t_{nn} := QR,

其中 $Q = (η_{1}, η_{2}, \dots, η_{n})$ 是正交矩阵, $R$ 是主对角元 $t_{ii}$ 全大于零的实上三角矩阵.
再证唯一性. 设 $A = Q_{1} R_{1}$ 是满足要求的另一个分解, 则 $Q_{1} R_{1} = QR$ , 即 $Q^{- 1} Q_{1} = R R_{1}^{- 1}$ . 可见 $Q^{- 1} Q_{1} = R R_{1}^{- 1}$ 既是正交矩阵又是上三角矩阵, 因而必为对角矩阵, 且主对角元等于 $1$ 或 $- 1$ . 但 $R_{1}$ 和 $R$ 的主对角元都为正, 故 $R R_{1}^{- 1} = E$ , 即 $R = R_{1}$ , 从而 $Q = Q_{1}$ .

方法2:

Givens 矩阵

定义如下初等变换矩阵

P (i, j; θ) := 1 ⋱ 1 cos θ - sin θ ⋱ sin θ cos θ 1 ⋱ 1

为 Givens 矩阵 (变换), 它是通过将一个 $n$ 阶单位阵 $E_{n}$ 更改四个位置的元素得到的:

p_{ii} = p_{j j} = cos θ, p_{ij} = - p_{j i} = sin θ .

这对应了 ${e_{i}, e_{j}}$ 平面上的一个旋转, $θ$ 称为旋转角. 可以验证它是正交矩阵. 以及以下均假设 $1 \leq i < j \leq n$ . 设 $P$ 如上定义, 对矩阵 $A = (a_{ij})_{n \times n}$ 做一次变换 $P A$ , 可以让矩阵中一个元素 $a_{j i}$ 变为零, 以下假设 $a_{j i} \neq = 0$ 否则不需要做变化:

取 $sin θ = \frac{a _{j i}}{a _{j i}^{2} + a _{j i}^{2}}$ , $cos θ = \frac{a _{ii}}{a _{ii}^{2} + a _{j i}^{2}}$ .
$B = (b_{ij}) = P A$ 只改变 $A$ 的第 $i, j$ 行元素, 且 $(b_{ik} b_{j k}) = (cos θ - sin θ sin θ cos θ) (a_{ik} a_{j k}) .$
由此, $b_{j i} = 0$ . 不断施加这样的运算, 可以让 $A$ 的对角线以下元素均为零, 这里最多需要 $\frac{n ( n - 1 )}{2}$ 次变换. 假设为把 $a_{j i}$ 处变为零，那么 $A$ 通过一系列的正交变换 $P := \prod_{1 \leq i < j \leq n} P (i, j)$ 之后变为上三角矩阵 $R$ , 这也就验证了 QR 分解: $A = P R .$

方法3: 因为 $A^{T} A$ 为正定矩阵，于是由Cholesky分解，存在主对角元均大于0的实上三角矩阵 $U$ ，使得

A^{T} A = U^{T} U

取 $P = (A^{T})^{- 1} U^{T}$ ，则 $A = P U$ ，其中 $P$ 为正交矩阵

LU分解

LU分解

对于 $A \in F^{n \times n}$ ，存在 $C, B \in F^{n \times n}$ 使得 $A = B C$ ，其中 $B$ 为主对角线均为 1 的下三角矩阵， $C$ 为上三角矩阵.
$C$ 为可逆上三角矩阵的充要条件是 $A$ 的顺序主子式全不为0(或 $a_{ii} \neq = 0$ )，并且此时分解是唯一的

方法1: 使用归纳法
充分性: 当 $n = 1$ 命题显然成立. 设命题对 $n - 1$ 时成立, 当 $n$ 时, 设

A = (A_{n - 1} β^{T} α a_{nn}), A_{n - 1} \in F^{(n - 1) \times (n - 1)}, α, β \in F^{n - 1}, a_{nn} \in F .

由归纳假设, 存在 $C_{n - 1}, B_{n - 1} \in F^{(n - 1) \times (n - 1)}$ 使得 $A_{n - 1} = B_{n - 1} C_{n - 1}$ 其中 $B_{n - 1}$ 为主对角元都为 $1$ 的下三角矩阵, $C_{n - 1}$ 为可逆上三角矩阵. 注意到

A = (A_{n - 1} β^{T} α a_{nn}) = (B_{n - 1} C_{n - 1} β^{T} α a_{nn}) \to (B_{n - 1} C_{n - 1} 0 α a_{nn} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} α),

对应的初等行变换矩阵如下

(E_{n - 1} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} 01) A = (B_{n - 1} C_{n - 1} 0 α a_{nn} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} α) .

于是我们有

A = (E_{n - 1} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} 01)^{- 1} (B_{n - 1} 0 01) (C_{n - 1} 0 B_{n - 1}^{- 1} α a_{nn} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} α) = B C,

其中

B = (E_{n - 1} β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} 01) (B_{n - 1} 0 01) = (B_{n - 1} β^{T} C_{n - 1}^{- 1} 01)

是主对角元都为 $1$ 的下三角矩阵 (因为 $B_{n - 1}$ 是), 且

C = (C_{n - 1} 0 B_{n - 1}^{- 1} α a_{nn} - β^{T} C_{n - 1}^{- 1} B_{n - 1}^{- 1} α)

是上三角矩阵 (因为 $C_{n - 1}$ 是). 因为 $det A \neq = 0$ , 所以 $C$ 是可逆矩阵.(顺序主子式不为0的条件保证了归纳的合理性)

必要性: 当 $n = 1$ 命题显然成立. 假设命题对 $n - 1$ 时成立, 则当 $n$ 时, 设 $A = B C$ 且 $B$ 为主对角元都为 $1$ 的下三角矩阵, $C$ 为可逆上三角矩阵.
假设

B = (B_{n - 1}^{'} γ^{T} 01), C = (C_{n - 1}^{'} 0 η c_{nn}), B_{n - 1}^{'}, C_{n - 1}^{'} \in F^{(n - 1) \times (n - 1)}, c_{nn} \in F ∖ {0} .

现在就有

A = B C = (B_{n - 1}^{'} C_{n - 1}^{'} γ^{T} C_{n - 1}^{'} B_{n - 1}^{'} η γ^{T} η + c_{nn}) .

由归纳假设知 $B_{n - 1}^{'} C_{n - 1}^{'}$ 顺序主子式不为 $0$ . 显然 $det A \neq = 0$ , 这就证明了 $n$ 的情况

唯一性: 若还有 $A = B C = B^{'} C^{'}$ , 这里 $B^{'}$ 为主对角元都为 $1$ 的下三角矩阵, $C^{'}$ 为可逆上三角矩阵. 于是

C (C^{'})^{- 1} = B^{- 1} B^{'} .

注意到上式左边是上三角矩阵, 右边是主对角线全为 $1$ 的下三角矩阵, 故

C (C^{'})^{- 1} = B^{- 1} B^{'} = E_{n},

从而 $C = C^{'}, B = B^{'}$ , 这就完成了证明.

方法2: Gauss消元法

要进行Gauss消元法需要对角元不为0，下面的引理证明了对角元不为0和顺序主子式不为0的等价性

引理

对角元素 $a_{ii}^{(i)} \neq = 0$ ( $i = 1, 2, \dots, k$ ) 的充要条件是矩阵 $A$ 的顺序主子式 $D_{i} \neq = 0$ ( $i = 1, 2, \dots, k$ ), 即
$D_{1} = a_{11} \neq = 0,$ $D_{i} = a_{11} ⋮ a_{i 1} \dots ⋱ \dots a_{1 i} ⋮ a_{ii} \neq = 0 (i = 2, 3, \dots, k) .$

证明: 采用归纳法证明引理的充分性. 显然, 当 $k = 1$ 时引理的充分性是成立的. 现假设引理对 $k - 1$ 是成立的, 求证引理对 $k$ 亦成立. 由归纳法, 设 $a_{ii}^{(i)} \neq = 0$ ( $i = 1, 2, \dots, k - 1$ ), 于是可用 Gauss 消去法将 $A^{(1)} = A$ 约化到 $A^{(k)}$ 中, 即

A^{(1)} \to A^{(k)} = a_{11}^{(1)} a_{12}^{(1)} a_{22}^{(2)} \dots \dots ⋱ \dots\dots\dots\dots a_{1 n}^{(1)} \dots\dots\dots\dots a_{2 n}^{(2)} ⋮ a_{k k}^{(k)} ⋮ a_{nk}^{(k)} \dots ⋱ \dots a_{k n}^{(k)} ⋮ a_{nn}^{(k)},

且有

D_{2} = a_{11}^{(1)} 0 a_{12}^{(1)} a_{22}^{(2)} = a_{11}^{(1)} a_{22}^{(2)}, D_{3} = a_{11}^{(1)} a_{22}^{(2)} a_{33}^{(3)},

D_{k} = a_{11}^{(1)} a_{12}^{(1)} a_{22}^{(2)} \dots \dots ⋱ a_{1 k}^{(1)} a_{2 k}^{(2)} ⋮ a_{k k}^{(k)} = a_{11}^{(1)} a_{22}^{(2)} \dots a_{k k}^{(k)} . (⋆)

由设 $D_{i} \neq = 0$ ( $i = 1, 2, \dots, k$ ) , 有 $a_{k k}^{(k)} \neq = 0$ , 即引理对 $k$ 的充分性成立.
必要性则由 $(⋆)$ 式显然可得

现在用Gauss消元法证明LU分解

设线性方程组

⎩ ⎨ ⎧ a_{11} x_{1} + a_{12} x_{2} + \dots + a_{1 n} x_{n} = b_{1}, a_{21} x_{1} + a_{22} x_{2} + \dots + a_{2 n} x_{n} = b_{2}, ⋮ a_{n 1} x_{1} + a_{n 2} x_{2} + \dots + a_{nn} x_{n} = b_{n}, (1)

或写成矩阵形式 $A x = b$ , 其中

A = a_{11} a_{21} ⋮ a_{n 1} a_{12} a_{22} ⋮ a_{n 2} \dots \dots ⋱ \dots a_{1 n} a_{2 n} ⋮ a_{nn}, x = x_{1} x_{2} ⋮ x_{n}, b = b_{1} b_{2} ⋮ b_{n} .

设 $A$ 的各顺序主子式均不为零. 于是由引理，可以进行Gauss消元法，由于对 $A$ 施行行的初等变换相当于用初等矩阵左乘 $A$ , 于是对式 (1) 施行第一次消元后 $a_{11}$ 下面的元素全部变为0 ,记 $A := A^{(1)}$ ，这时 $A^{(1)}$ 化为 $A^{(2)}$ , $b^{(1)}$ 化为 $b^{(2)}$ , 即

L_{1} A^{(1)} = A^{(2)}, L_{1} b^{(1)} = b^{(2)},

其中

L_{1} = 1 - m_{21} - m_{31} ⋮ - m_{n 1} 10 1 ⋱ ⋱ 1 .

一般第 $k$ 步消元, $A^{(k)}$ 化为 $A^{(k + 1)}$ , $b^{(k)}$ 化为 $b^{(k + 1)}$ , 相当于

L_{k} A^{(k)} = A^{(k + 1)}, L_{k} b^{(k)} = b^{(k + 1)} .

重复这一过程, 最后得到

{L_{n - 1} \dots L_{2} L_{1} A^{(1)} = A^{(n)}, L_{n - 1} \dots L_{2} L_{1} b^{(1)} = b^{(n)},

其中

L_{k} = 1 ⋱ 1 - m_{k + 1, k} ⋮ - m_{nk} 1 ⋱ 1 .

将上三角矩阵 $A^{(n)}$ 记作 $U$ , 于是

A = L_{1}^{- 1} L_{2}^{- 1} \dots L_{n - 1}^{- 1} U = LU,

其中

L = L_{1}^{- 1} L_{2}^{- 1} \dots L_{n - 1}^{- 1} = 1 m_{21} m_{31} ⋮ m_{n 1} 1 m_{32} ⋮ m_{n 2} 1 ⋱ \dots ⋱ m_{n, n - 1} 1

为单位下三角矩阵. 于是我们就完成了证明

正规矩阵的分解

半正定矩阵的k次方根

半正定矩阵的k次方根

设 $A$ 是 $n$ 阶半正定实对称矩阵，则对任意的正整数 $k > 1$ ,必存在唯一的 $n$ 阶半正定实对称矩阵 $B$ ,使得

A = B^{k} .

这样的半正定阵 $B$ 称为半正定阵 $A$ 的 $k$ 次方根，记为 $B = A^{\frac{1}{k}} .$

证明: 设 $P$ 是正交矩阵，使得 $P^{T} A P = diag {λ_{1}, λ_{2}, \dots, λ_{n}}$ ,其中 $λ_{i} \geq 0$ 是 $A$ 的特征值.令

B = P diag {λ_{1}^{\frac{1}{k}}, λ_{2}^{\frac{1}{k}}, \dots, λ_{n}^{\frac{1}{k}}} P^{T}

则 $B$ 为半正定阵且 $A = B^{k}$ 这就证明了 $k$ 次方根的存在性.
设 $B$ 是 $A$ 的 $k$ 次方根，则对 $B$ 的任一特征值 $μ_{i}, μ_{i}^{k}$ 是 $A$ 的特征值，即 $μ_{i}$ 是 $A$ 的某个特征值的非负 $k$ 次方根. 由Largrange插值法，不难证明存在一个只和 $A$ 的所有特征值的非负 $k$ 次方根有关的实系数多项式 $f (x)$ ,使得 $B = f (B^{k}) = f (A)$ .设 $C$ 是 $A$ 的另一个 $k$ 次方根，则同上讨论也有 $C = f (A)$ ,从而 $B = C$ ,这就证明了 $k$ 次方根的唯一性.

Cholesky分解

Cholesky分解

设 $A$ 是 $n$ 阶正定实对称矩阵，则存在实 $n$ 阶上三角矩阵 $L$ ,且 $L$ 的主对角线上的元素均不为零，使
$A = L L^{T} .$

方法1: 对 $n$ 用归纳法.
当 $n = 1$ 时,结论显然成立. 设 $n \geq 2$ ,并假设 $n - 1$ 阶结论成立,下证对于 $n$ 阶正定矩阵 $A$ 结论也成立. 将 $A$ 块分为 $A = (a_{11} β β^{T} A_{1})$ ,其中 $β$ 是 $n - 1$ 阶实列向量, $A_{1}$ 为 $n - 1$ 阶实对称矩阵.
因为 $A$ 正定,所以 $A_{1}$ 也是正定的,从而是可逆的. 于是有

(10 - β^{T} A_{1}^{- 1} E_{n - 1}) (a_{11} β β^{T} A_{1}) (1 - A_{1}^{- 1} β 0 E_{n - 1}) = (a_{11} - β^{T} A_{1}^{- 1} β 0 0 A_{1}) .

令 $b = a_{11} - β^{T} A_{1}^{- 1} β$ ,同取行列式，可知 $b > 0$ . 又根据归纳假设,存在主对角元均为正的实 $n - 1$ 阶上三角矩阵 $L_{1}$ ,使 $A_{1} = L_{1} L_{1}^{T}$ . 因此,上式可表述为

(a_{11} β β^{T} A_{1}) = (10 - β^{T} A_{1}^{- 1} E_{n - 1})^{- 1} (b 0 0 L_{1}) (b 0 0 L_{1}^{T}) (1 - A_{1}^{- 1} β 0 E_{n - 1})^{- 1} .

令 $L = (10 - β^{T} A_{1}^{- 1} E_{n - 1})^{- 1} (b 0 0 L_{1})$ ,则 $L$ 是主对角元均为正的实 $n$ 阶上三角矩阵,且 $A = L L^{T}$ .

方法2: 使用QR分解
存在可逆矩阵 $B$ 使得 $A = B^{T} B$
由QR分解，存在正交矩阵 $Q$ 和主对角元全为正实数的上三角矩阵 $R$ , 使得 $B = QR$ ，于是

A = (QR)^{T} (QR) = R^{T} R

这就完成了证明

二阶旋转矩阵分解

二阶旋转矩阵分解

任何一个二阶旋转矩阵可以分解为两个镜面反射矩阵的乘积

任何一个二维旋转都可以由两次连续的镜面反射得到。几何上，一个向量先关于直线 $L_{1}$ 反射，再关于直线 $L_{2}$ 反射，其效果等同于一个旋转，旋转角度是 $L_{1}$ 与 $L_{2}$ 夹角的两倍。代数上，我们可以构造出来。一个关于 $x$ 轴的反射矩阵是

H_{1} = (10 0 - 1)

一个关于与 $x$ 轴夹角为 $ϕ$ 的直线的反射矩阵是

H_{2} = (cos (2 ϕ) sin (2 ϕ) sin (2 ϕ) - cos (2 ϕ))

它们的乘积是：

H_{2} H_{1} = (cos (2 ϕ) sin (2 ϕ) sin (2 ϕ) - cos (2 ϕ)) (10 0 - 1) = (cos (2 ϕ) sin (2 ϕ) - sin (2 ϕ) cos (2 ϕ)) = R (2 ϕ)

因此，任何一个旋转角为 $θ = 2 ϕ$ 的旋转矩阵 $R (θ)$ 都可以分解为两个反射矩阵的乘积

Cartan-Dieudonné 定理

Cartan-Dieudonné 定理

任一 $n$ 阶正交矩阵 $A$ 都可表示成不超过 $n$ 个 $n$ 阶镜面反射矩阵之积

方法1: 使用归纳法.
当 $n = 1$ 时，结论显然. 假设 $n - 1$ 时结论成立，对于 $n$ 阶正交矩阵 $A$ ,设 $η$ 是 $A$ 的第一列
(因而是单位向量) $, e = (1, 0, \dots, 0, 0)^{T}$ ，由12. 内积空间与辛空间的投影 > 垂直平行投影中的镜面反射结论，存在 $n$ 阶镜面反射矩阵 $B_{0}$ ,使得 $B_{0} η = e$ ,故

B_{0} A = (10 α^{T} A_{1}) .

注意到 $B_{0} A$ 是正交矩阵，从而 $α = 0$ ,且 $A_{1}$ 是 $n - 1$ 阶正交矩阵.根据归纳假设，存在至多 $n - 1$ 个 $n - 1$ 阶镜面反射矩阵 $B_{1}, B_{2}, \dots, B_{n - 1}$ ,使得 $A_{1} = B_{1} B_{n - 1} \dots B_{2}$ .因此，有

A = B_{0} (1 B_{1}) (1 B_{2}) \dots (1 B_{n - 1}) .

易知，上式右边的每一个因子都是 $n$ 阶镜面反射矩阵，且个数不超过 $n$ ，命题得证

方法2: 使用正交矩阵标准型
由正规矩阵标准型，任何一个 $n$ 维正交矩阵 $A$ 都可以通过正交相似变换化为分块对角矩阵，即存在一个正交矩阵 $P$ ，使得：

D = P^{T} A P

其中 $D$ 的形式如下：

D = I_{k} - I_{m} R (θ_{1}) ⋱ R (θ_{l})

$R (θ_{j})$ 是 $2 \times 2$ 的旋转矩阵：

R (θ_{j}) = (cos θ_{j} sin θ_{j} - sin θ_{j} cos θ_{j}), 其中 sin θ_{j} \neq = 0 。

矩阵的维数满足 $k + m + 2 l = n$
现在我们将 $D$ 分解为镜面反射矩阵的乘积，一方面， $- I_{m}$ 可以分解为 $m$ 个镜面反射矩阵(主对角线元只有1个-1，1，再用 1 作为其他主对角元补成 $n$ 阶镜面反射矩阵)，另一方面，由二阶旋转矩阵分解，每个 $R (θ_{j})$ 可分解为两个二阶镜面反射矩阵乘积，然后再令主对角元的其他位置为 1 就是一个 $n$ 阶镜面反射矩阵。因此我们得到了 $m + 2 l = n - k$ 个镜面反射矩阵的乘积，由于 $k \geq 0$ ，因此 $D$ 至多可分解为 $n$ 个镜面反射矩阵乘积

对 $P$ 进行分块，对每个镜面反射矩阵 $D_{i}$ ， $P_{i}^{T} D_{i} P$ 仍是一个镜面反射矩阵(特征值仍然是 $- 1$ 和 $n - 1$ 个 $1$ )，因此就完成了证明

谱分解

谱分解

设 $V$ 是有限维内积空间， $φ$ 是 $V$ 上的线性算子，当 $V$ 是酉空间时 $φ$ 为正规算子；当 $V$ 是欧氏空间时 $φ$ 为自伴随算子。 $λ_{1}, λ_{2}, \dots, λ_{k}$ 是 $φ$ 全体不同的特征值， $W_{i}$ 为 $φ$ 属于 $λ_{i}$ 的特征子空间，则 $V$ 是 $W_{i} (i = 1, 2, \dots, k)$ 的正交直和。这时若设 $E_{i}$ 是 $V$ 到 $W_{i}$ 上的正交投影，则 $φ$ 有下列分解式：

φ = λ_{1} E_{1} + λ_{2} E_{2} + \dots + λ_{k} E_{k} .

证明: 由于正规矩阵不同特征值对应的特征子空间相互正交，故

V = W_{1} ⊥ W_{2} ⊥ \dots ⊥ W_{k} .

又因为 $E_{i}$ 是 $V \to W_{i}$ 的正交投影，故

I = E_{1} + E_{2} + \dots + E_{k},

注意 $φ E_{i} = λ_{i} E_{i}$ ，于是

φ = φ E_{1} + φ E_{2} + \dots + φ E_{k} = λ_{1} E_{1} + λ_{2} E_{2} + \dots + λ_{k} E_{k} .

总结

不难发现半正定矩阵的k次方根，极分解，奇异值分解，QR分解，Cholesky分解之间存在着能够相互证明的路径，最后每个分解用一句话总结一下就是

总结

满秩分解：将矩阵分解为一个列满秩矩阵与一个行满秩矩阵的乘积

Fitting分解：将线性空间分解为幂零变换与可逆变换的不变子空间直和

Voss分解：任意实矩阵可表示为两个实对称矩阵的乘积，且其中之一可逆

Jordan-Chevalley分解：矩阵唯一分解为可对角化部分与幂零部分的和，且二者可交换

奇异值分解：通过正交（酉）变换将矩阵化为非负奇异值构成的对角分块矩阵

极分解：矩阵可分解为正交（酉）矩阵与半正定矩阵的乘积

QR分解：可逆矩阵可唯一分解为正交矩阵与主对角元正的上三角矩阵的乘积，源于Gram-Schmidt正交化

LU分解：若 $A$ 的顺序主子式全不为0(或 $a_{ii} \neq = 0$ )，则其可以分解为一个主对角元为1的上三角矩阵和下三角矩阵的乘积

半正定矩阵的k次方根：半正定矩阵可表示为另一个半正定矩阵的k次方

Cholesky分解：正定对称矩阵可唯一分解为下三角矩阵与其转置的乘积

Cartan-Dieudonné定理：正交矩阵可表示为有限个镜面反射的乘积

谱分解：正规算子可表示为特征值与其对应正交投影算子的线性组合

tags	数学, 高等代数, 矩阵分解
authors	blueraina
status	stable
owner	blueraina

群知识库

AI 找笔记

Explorer

矩阵的标准型与分解

矩阵的标准型

相抵标准型

有理标准型

Jordan标准型

广义Jordan标准型

正规矩阵标准型

矩阵的分解

一般矩阵分解

满秩分解

Fitting分解

Voss分解

Jordan-Chevalley分解

奇异值分解

极分解

QR分解

LU分解

正规矩阵的分解

半正定矩阵的k次方根

Cholesky分解

二阶旋转矩阵分解

Cartan-Dieudonné 定理

谱分解

总结

评论

Graph View

目录

反向链接