对角化
特征子空间
矩阵 𝐴 的属于 𝜆0
 的属于 𝜆0 的全部特征向量,再添上零向量,构成一个线性空间,称为矩阵 𝐴
 的全部特征向量,再添上零向量,构成一个线性空间,称为矩阵 𝐴 的一个特征子空间,记为 𝐸(𝜆0)
 的一个特征子空间,记为 𝐸(𝜆0) 。它是齐次线性方程组:
。它是齐次线性方程组:
(𝜆0𝐼−𝐴)𝑋=0
的解空间。
对于特征子空间 𝐸(𝜆𝑖) =𝑁(𝜆𝑖𝐼 −𝐴) ,由亏加秩定理有:
,由亏加秩定理有:
𝑟(𝜆𝑖𝐼−𝐴)+dim𝑁(𝜆𝑖𝐼−𝐴)=𝑛
因此,特征子空间 𝐸(𝜆𝑖) 的维数为:
 的维数为:
dim𝐸(𝜆𝑖)=𝑛−𝑟(𝜆𝑖𝐼−𝐴)
也称为 𝜆𝑖 的 几何重数。
 的 几何重数。
不变子空间
在研究线性变换 𝑇 的时候,常常希望选取空间 𝑉
 的时候,常常希望选取空间 𝑉 的一个基,使得线性变换 𝑇
 的一个基,使得线性变换 𝑇 对于这个基的矩阵具有尽可能简单的形状。
 对于这个基的矩阵具有尽可能简单的形状。
设 𝑉 是数域 𝐹
 是数域 𝐹 上的线性空间,𝑊
 上的线性空间,𝑊 是 𝑉
 是 𝑉 的一个子空间,𝑇
 的一个子空间,𝑇 是 𝑉
 是 𝑉 上的一个线性变换。如果对于 𝑊
 上的一个线性变换。如果对于 𝑊 中任意的向量 𝑥
 中任意的向量 𝑥 ,都有 𝑇(𝑥)
,都有 𝑇(𝑥) 也在 𝑊
 也在 𝑊 中(也称为空间在变换下不变或稳定),称 𝑊
 中(也称为空间在变换下不变或稳定),称 𝑊 是 𝑇
 是 𝑇 的一个不变子空间。
 的一个不变子空间。
空间在变换下不变,并不是说坐标在变换下真的「不变」,有可能是进行了一个拉伸等变形,只是变形后还落在空间里。
- 线性空间 𝑉 的任意一个子空间都是数乘变换的不变子空间。 的任意一个子空间都是数乘变换的不变子空间。
- 对于 𝑉 中任意的线性变换 𝑇 中任意的线性变换 𝑇 ,空间 𝑉 ,空间 𝑉 和零子空间都是 𝑇 和零子空间都是 𝑇 的不变子空间,称为平凡不变子空间。 的不变子空间,称为平凡不变子空间。
- 不变子空间的交与和也是不变子空间。
设 𝑊 是线性变换 𝑇
 是线性变换 𝑇 的一个不变子空间。只考虑 𝑇
 的一个不变子空间。只考虑 𝑇 在不变子空间 𝑊
 在不变子空间 𝑊 上的作用,就得到子空间 𝑊
 上的作用,就得到子空间 𝑊 本身的线性变换,称为 𝑇
 本身的线性变换,称为 𝑇 在子空间 𝑊
 在子空间 𝑊 上的限制,记作 𝑇|𝑊
 上的限制,记作 𝑇|𝑊 。
。
对于 𝑉 中任意的线性变换 𝑇
 中任意的线性变换 𝑇 ,像空间 𝑅(𝑇)
,像空间 𝑅(𝑇) 与核空间 𝑁(𝑇)
 与核空间 𝑁(𝑇) 是 𝑇
 是 𝑇 的不变子空间。这两种情况的含义是,空间 𝑉
 的不变子空间。这两种情况的含义是,空间 𝑉 在变换前后,完成了自身的压缩(像空间),或者压缩到 0
 在变换前后,完成了自身的压缩(像空间),或者压缩到 0 (核空间)。
(核空间)。
对于 𝑉 中任意的线性变换 𝑇
 中任意的线性变换 𝑇 ,𝑇
,𝑇 的特征子空间是 𝑇
 的特征子空间是 𝑇 的不变子空间。
 的不变子空间。
准素分解
根据代数基本定理,最小多项式可以分解为:
𝑚𝐴(𝜆)=(𝜆−𝜆1)𝑟1⋯(𝜆−𝜆𝑆)𝑟𝑆
考虑最小多项式代入变元 𝜆 为矩阵 𝐴
 为矩阵 𝐴 后,各个因式的核空间,构成矩阵 𝐴
 后,各个因式的核空间,构成矩阵 𝐴 的一系列不变子空间:
 的一系列不变子空间:
𝑊𝑖=𝑁((𝜆𝑖𝐼−𝐴)𝑟𝑖)
定理:该不变子空间 𝑊𝑖 的维数,恰好为特征值 𝜆𝑖
 的维数,恰好为特征值 𝜆𝑖 的代数重数。
 的代数重数。
回顾一下,代数重数是指特征多项式各个因式的次数,几何重数是指特征子空间 𝐸(𝜆𝑖) =𝑁(𝜆𝑖𝐼 −𝐴) 的维数。这个不变子空间 𝑊𝑖
 的维数。这个不变子空间 𝑊𝑖 与特征子空间 𝐸(𝜆𝑖)
 与特征子空间 𝐸(𝜆𝑖) ,两者都是矩阵的核空间,并且两个矩阵构成最小多项式 𝑟𝑖
,两者都是矩阵的核空间,并且两个矩阵构成最小多项式 𝑟𝑖 次幂的关系。也就是说,特征子空间的维数是几何重数,「特征子空间」经过最小多项式 𝑟𝑖
 次幂的关系。也就是说,特征子空间的维数是几何重数,「特征子空间」经过最小多项式 𝑟𝑖 次幂后到达一个「不变子空间」,不变子空间的维数到达了特征多项式的代数重数。
 次幂后到达一个「不变子空间」,不变子空间的维数到达了特征多项式的代数重数。
该定理其实是下面准素分解定理的推论。
记矩阵 𝐴 对应的线性变换 𝑇
 对应的线性变换 𝑇 ,在每个子空间 𝑊𝑖
,在每个子空间 𝑊𝑖 上的限制 𝑇𝑖 =𝑇|𝑊𝑖
 上的限制 𝑇𝑖 =𝑇|𝑊𝑖 。于是 𝑇𝑖
。于是 𝑇𝑖 的最小多项式是 (𝑥 −𝜆𝑖)𝑟𝑖
 的最小多项式是 (𝑥 −𝜆𝑖)𝑟𝑖 。
。
定理:设 𝑉 是域 𝐹
 是域 𝐹 上的线性空间,𝑇
 上的线性空间,𝑇 是 𝑉
 是 𝑉 上的一个线性变换。那么空间 𝑉
 上的一个线性变换。那么空间 𝑉 可以关于线性变换 𝑇
 可以关于线性变换 𝑇 进行准素分解,拆成若干不变子空间 𝑊𝑖
 进行准素分解,拆成若干不变子空间 𝑊𝑖 的直和。
 的直和。
𝑉=𝑊1⊕𝑊2⊕⋯⊕𝑊𝑆
这意味着,𝑇 在某组基下的矩阵是准对角阵:
 在某组基下的矩阵是准对角阵:
diag{𝐴1,𝐴2,⋯,𝐴𝑆}
其中,𝐴𝑖 是 𝑇𝑖
 是 𝑇𝑖 在对应基下的矩阵。
 在对应基下的矩阵。
该定理表明,可以使用不变子空间简化线性变换的矩阵。
可对角化矩阵
对于 𝑛 阶方阵 𝐴
 阶方阵 𝐴 ,如果相似于一个对角阵,则称 𝐴
,如果相似于一个对角阵,则称 𝐴 为可对角化矩阵,或称单纯矩阵。
 为可对角化矩阵,或称单纯矩阵。
- 对角阵的和、积、逆,如果存在,仍然是对角阵,其对角线上的元素就是它的特征值。
- 线性变换 𝑇 的矩阵为可对角化矩阵,等价于 𝑇 的矩阵为可对角化矩阵,等价于 𝑇 在某组基下的矩阵为对角阵。 在某组基下的矩阵为对角阵。
定理:设矩阵 𝐴 的全部互异特征根为 𝜆1,⋯,𝜆𝑚
 的全部互异特征根为 𝜆1,⋯,𝜆𝑚 ,则以下命题等价:
,则以下命题等价:
- 矩阵 𝐴 可对角化。 可对角化。
- 矩阵 𝐴 有 𝑛 有 𝑛 个线性无关的特征向量。 个线性无关的特征向量。
- 以下公式成立:
dim𝐸(𝜆1)+⋯+dim𝐸(𝜆𝑚)=𝑛
前文已经指出,特征多项式的分解式中特征值的次数称为代数重数,特征子空间的维数称为几何重数。这个定理也表明,矩阵 𝐴 可对角化,等价于 𝐴
 可对角化,等价于 𝐴 的每个特征值 𝜆
 的每个特征值 𝜆 的代数重数都等于它的几何重数。
 的代数重数都等于它的几何重数。
推论:如果 𝑛 阶方阵 𝐴
 阶方阵 𝐴 恰有 𝑛
 恰有 𝑛 个互异特征值,则它必可对角化。反之则不一定。
 个互异特征值,则它必可对角化。反之则不一定。
定理:矩阵 𝐴 可对角化当且仅当 𝐴
 可对角化当且仅当 𝐴 的最小多项式没有重根。
 的最小多项式没有重根。
矩阵的相似也会保持特征向量之间的线性相关关系不变。
特征向量完全可能不是实数,也完全可能找不到 𝑛 个线性无关的特征向量。
 个线性无关的特征向量。
对于重特征值而言,特征向量张成空间。为了描述这个空间,需要从其中选择代表。一般会选择线性无关的代表,代表的个数就是空间的维数。
选取代表时,常常将它们正交化与单位化。最终得到的就是一套单位正交的代表。
特征向量不一定正交,不同特征值的特征向量,可能无法正交。因此正交化只能对于重特征值的特征向量进行。但是单位化可以对任意特征向量进行。
幂零矩阵
设 𝑇 是空间 𝑉
 是空间 𝑉 的一个线性变换。如果存在一个正整数 𝑟
 的一个线性变换。如果存在一个正整数 𝑟 ,使得 𝑇𝑟
,使得 𝑇𝑟 为零变换,称 𝑇
 为零变换,称 𝑇 是空间 𝑉
 是空间 𝑉 的一个幂零变换。
 的一个幂零变换。
对于某一个正整数 𝑟 ,满足条件 𝑁𝑟 =0
,满足条件 𝑁𝑟 =0 的矩阵称为幂零矩阵。
 的矩阵称为幂零矩阵。
一般可以进一步假定 𝑟 是使 𝑇𝑟
 是使 𝑇𝑟 为零变换的最小正整数,于是 𝑇
 为零变换的最小正整数,于是 𝑇 的最小多项式是 𝑥𝑟
 的最小多项式是 𝑥𝑟 。于是存在一个向量 𝜉0
。于是存在一个向量 𝜉0 ,使得:
,使得:
- 𝑇𝑟(𝜉0)=0 
- 𝑇𝑟−1(𝜉0)≠0 
循环子空间
定理:设 𝑇 是空间 𝑉
 是空间 𝑉 的一个线性变换,𝜉
 的一个线性变换,𝜉 是空间 𝑉
 是空间 𝑉 的一个向量。如果存在一个正整数 𝑠
 的一个向量。如果存在一个正整数 𝑠 ,使得:
,使得:
- 𝑇𝑠(𝜉)=0 
- 𝑇𝑠−1(𝜉)≠0 
那么向量 𝜉,𝑇(𝜉),⋯,𝑇𝑠−1(𝜉) 线性无关。
 线性无关。
由这个定理可以给出一个定义:
设 𝑇 是空间 𝑉
 是空间 𝑉 的一个线性变换,𝑊
 的一个线性变换,𝑊 是 𝑉
 是 𝑉 的一个子空间。如果存在一个向量 𝜉0
 的一个子空间。如果存在一个向量 𝜉0 和一个正整数 𝑟
 和一个正整数 𝑟 ,使得:
,使得:
那么子空间 𝑊 称为关于 𝑇
 称为关于 𝑇 的一个循环子空间,简称 𝑇
 的一个循环子空间,简称 𝑇 循环子空间。此时 𝜉0
 循环子空间。此时 𝜉0 称为循环子空间 𝑊
 称为循环子空间 𝑊 的一个生成向量,向量 𝜉0,𝑇(𝜉0),⋯,𝑇𝑟−1(𝜉0)
 的一个生成向量,向量 𝜉0,𝑇(𝜉0),⋯,𝑇𝑟−1(𝜉0) 称为 𝑊
 称为 𝑊 的一个循环基。
 的一个循环基。
显然,一个 𝑇 循环子空间 𝑊
 循环子空间 𝑊 在 𝑇
 在 𝑇 作用下不变,并且对于循环子空间 𝑊
 作用下不变,并且对于循环子空间 𝑊 中的任意向量 𝜉
 中的任意向量 𝜉 ,均有 𝑇𝑟(𝜉) =0
,均有 𝑇𝑟(𝜉) =0 ,这里 𝑟
,这里 𝑟 为循环子空间的维数。
 为循环子空间的维数。
幂零 Jordan 块
如果空间 𝑊 是变换 𝑇
 是变换 𝑇 的循环子空间,那么 𝑇
 的循环子空间,那么 𝑇 在 𝑊
 在 𝑊 上的限制 𝑇|𝑊
 上的限制 𝑇|𝑊 是 𝑊
 是 𝑊 的一个幂零变换,并且 𝑇|𝑊
 的一个幂零变换,并且 𝑇|𝑊 关于 𝑊
 关于 𝑊 的倒序排列的循环基 𝑇𝑟−1(𝜉0),𝑇𝑟−2(𝜉0),⋯,𝜉0
 的倒序排列的循环基 𝑇𝑟−1(𝜉0),𝑇𝑟−2(𝜉0),⋯,𝜉0 的矩阵是如下形状的 𝑟
 的矩阵是如下形状的 𝑟 阶上三角矩阵:
 阶上三角矩阵:
𝑁𝑟=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝010⋯00001⋯00000⋯00⋮⋮⋮⋮⋮000⋯01000⋯00⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
矩阵 𝑁𝑟 称为一个 𝑟
 称为一个 𝑟 阶幂零 Jordan 矩阵,或者 𝑟
 阶幂零 Jordan 矩阵,或者 𝑟 阶幂零 Jordan 块。
 阶幂零 Jordan 块。
设 𝑇 是 𝑛
 是 𝑛 维空间 𝑉
 维空间 𝑉 的一个幂零变换,把出现在 𝑉
 的一个幂零变换,把出现在 𝑉 关于 𝑇
 关于 𝑇 的循环子空间的分解中,唯一确定的一组正整数 𝑟1 ≥⋯ ≥𝑟𝑆
 的循环子空间的分解中,唯一确定的一组正整数 𝑟1 ≥⋯ ≥𝑟𝑆 叫做 𝑇
 叫做 𝑇 的不变指数。
 的不变指数。
对于 𝑛 阶幂零矩阵 𝐴
 阶幂零矩阵 𝐴 ,𝐴
,𝐴 与一个上述形状的矩阵 𝑁
 与一个上述形状的矩阵 𝑁 相似,也唯一确定一个正整数序列 𝑟1 ≥⋯ ≥𝑟𝑆
 相似,也唯一确定一个正整数序列 𝑟1 ≥⋯ ≥𝑟𝑆 ,称为矩阵 𝐴
,称为矩阵 𝐴 的不变指数。
 的不变指数。
幂零阵虽然不能和对角阵相似,但是可以相似于这样的标准形式。在 Jordan 标准型,将相似对角化与幂零阵的标准形式,二者结合起来,给出一般的矩阵通过相似变换可以达到的标准形式。
一些定理
- 设 𝑇 是空间 𝑉 是空间 𝑉 的一个幂零变换,而 的一个幂零变换,而
 ℎ(𝑥)=𝑎0+𝑎1𝑥+⋯+𝑎𝑚𝑥𝑚  - 是一个多项式,那么当且仅当 𝑎0 ≠0 时,线性变换 ℎ(𝑇) 时,线性变换 ℎ(𝑇) 有逆变换。当 ℎ(𝑇) 有逆变换。当 ℎ(𝑇) 可逆时,ℎ(𝑇) 可逆时,ℎ(𝑇) 的逆变换也是 𝑇 的逆变换也是 𝑇 的一个多项式。 的一个多项式。
 
- 设 𝑇 是空间 𝑉 是空间 𝑉 的一个幂零变换,𝑊 的一个幂零变换,𝑊 是一个 𝑟 是一个 𝑟 维 𝑇 维 𝑇 循环子空间,𝜉 循环子空间,𝜉 是 𝑊 是 𝑊 中的向量。如果存在一个整数 𝑘 中的向量。如果存在一个整数 𝑘 ,使得 ,使得
 𝑇𝑟−𝑘(𝜉)=0  - 那么存在 𝑊 中的向量 𝜂 中的向量 𝜂 ,使得 ,使得
 𝜉=𝑇𝑘(𝜂) 
- 设 𝑇 是 𝑛 是 𝑛 维空间 𝑉 维空间 𝑉 的一个幂零变换,𝑥𝑟 的一个幂零变换,𝑥𝑟 是 𝑇 是 𝑇 的最小多项式,令 𝑊1 的最小多项式,令 𝑊1 是一个 𝑟 是一个 𝑟 维 𝑇 维 𝑇 循环子空间,那么存在 𝑊1 循环子空间,那么存在 𝑊1 的一个余子空间 𝑊2 的一个余子空间 𝑊2 ,使得: ,使得:
 𝑉=𝑊1⊕𝑊2  - 并且 𝑊2 也在 𝑇 也在 𝑇 作用下不变。 作用下不变。
 
- 设 𝑇 是 𝑛 是 𝑛 维空间 𝑉 维空间 𝑉 的一个幂零变换,那么 𝑉 的一个幂零变换,那么 𝑉 可以分解为 𝑇 可以分解为 𝑇 循环子空间的直和: 循环子空间的直和:
 𝑉=𝑊1⊕𝑊2⊕⋯⊕𝑊𝑆 
- 每一个 𝑛 阶幂零矩阵都与一个形如: 阶幂零矩阵都与一个形如:
 𝑁=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑁𝑟10𝑁𝑟2⋯0𝑁𝑟𝑆⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠  - 的矩阵相似,这里的每一个 𝑁𝑟𝑖 是一个 𝑟𝑖 是一个 𝑟𝑖 阶幂零 Jordan 块。 阶幂零 Jordan 块。
 
- 如果规定 𝑇 循环子空间 𝑊𝑖 循环子空间 𝑊𝑖 按照维数 𝑟𝑖 按照维数 𝑟𝑖 降序排列 𝑟1 ≥⋯ ≥𝑟𝑆 降序排列 𝑟1 ≥⋯ ≥𝑟𝑆 ,那么将 𝑉 ,那么将 𝑉 分解为 𝑇 分解为 𝑇 循环子空间的方法是由 𝑇 循环子空间的方法是由 𝑇 唯一确定的。 唯一确定的。
 
本页面最近更新:2023/3/22 15:46:23,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:CCXXXI, Great-designer, Tiphereth-A
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用