线性映射
研究线性映射是研究线性空间之间的映射。
线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系。
线性映射与线性变换
设 𝑉
和 𝑊
是域 𝐹
上的两个线性空间,𝑇
是 𝑉
到 𝑊
的一个映射。
如果对于 𝑊
中任意的向量 𝑥
和 𝑦
,域 𝐹
中任意的标量 𝑘
和 𝑙
,有:
𝑇(𝑘𝑥+𝑙𝑦)=𝑘𝑇𝑥+𝑙𝑇𝑦
称 𝑇
是 𝑉
到 𝑊
的一个线性映射。如果 𝑊 =𝑉
,则称 𝑇
是 𝑉
上的一个线性变换。
例如,恒等变换 𝑇𝑒
保持空间不变,零变换 𝑇0
将空间映射至零空间。
可以记 𝐿(𝑉,𝑊)
为所有 𝑉
到 𝑊
的线性映射构成的集合。对于全体线性变换 𝐿(𝑉,𝑉)
,也记为 𝐿(𝑉)
。
性质
- 线性映射将零向量映射到零向量。
- 线性映射保持线性运算形式不变,即,线性运算的线性映射,等于线性映射的线性运算。
- 线性映射保持线性相关性,即,映射前线性相关,映射后也线性相关。
但是线性映射不保持线性无关性。映射前线性无关,映射后不一定线性无关。
线性映射的矩阵表示
设 𝑉
的维数是 𝑛
,𝑉
的一组基为 𝛼1,⋯,𝛼𝑛
,𝑊
的维数是 𝑚
,𝑊
的一组基为 𝛽1,⋯,𝛽𝑚
,𝑇
是 𝑉
到 𝑊
的一个线性映射。
将每个 𝛼
经由 𝑇
映射后的向量用 𝛽
表示:
𝑇𝛼𝑗=𝑎1𝑗𝛽1+⋯+𝑎𝑚𝑗𝛽𝑚
采用矩阵记法:
𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛽1,⋯,𝛽𝑚)𝐴
称矩阵 𝐴
为线性映射 𝑇
在这两组基下的矩阵表示。
线性映射的核空间与像空间
这里的核空间与像空间是站在线性映射的视角下叙述的。借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的。
设 𝑇
是由空间 𝑉
到空间 𝑊
的线性映射,令:
𝑁(𝑇)={𝑥∈𝑉|𝑇𝑥=0}
𝑅(𝑇)=𝐼𝑚(𝑇)={𝑦∈𝑊|𝑦=𝑇𝑥,𝑉𝑥∈𝑉}
易验证 𝑁(𝑇)
为 𝑉
的子空间,𝑅(𝑇)
为 𝑊
的子空间,称 𝑁(𝑇)
及 𝑅(𝑇)
为 𝑉
的核空间和像空间,并称 𝑁(𝑇)
的维数为 𝑇
的 零度 或 亏,𝑅(𝑇)
的维数为 𝑇
的 秩。
定理:设 𝑇
是由空间 𝑉
到空间 𝑊
的线性映射,𝑉
的维数有限,则 𝑁(𝑇)
及 𝑅(𝑇)
均为有限维,且有:
dim𝑁(𝑇)+dim𝑅(𝑇)=dim𝑉
即 𝑇
的亏加秩等于其定义域 𝑉
的维数。
线性变换的矩阵表示
设 𝑉
的维数是 𝑛
,𝑉
的一组基为 𝛼1,⋯,𝛼𝑛
,𝑇
是 𝑉
上的一个线性变换,则有:
𝑇𝛼𝑗=𝑎1𝑗𝛼1+⋯+𝑎𝑛𝑗𝛼𝑛
采用矩阵记法:
𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛼1,⋯,𝛼𝑛)𝐴
称矩阵 𝐴
为线性变换 𝑇
在这组基下的矩阵表示。
由空间结构和 𝑇
的线性性质,𝑇
由 𝑇𝛼1,⋯,𝑇𝛼𝑛
完全确定,故由 𝑇
唯一确定一个矩阵 𝐴
。
定理:设 𝑉
的维数是 𝑛
,𝛼1,⋯,𝛼𝑛
为 𝑉
的一组基,任取 𝑛
阶方阵 𝐴
,有且仅有一个从 𝑉
到 𝑉
的线性变换 𝑇
,使得 𝑇
的矩阵恰好为 𝐴
。
推论:在 𝐿(𝑉,𝑉)
和全体 𝑛
阶方阵之间存在一一对应关系。
例如:零变换对应零矩阵,恒等变换对应单位矩阵。
线性变换构成的空间
定理:𝐿(𝑉)
也可以构成线性空间,引入 𝐿(𝑉)
中的运算:对于 𝐿(𝑉)
中任意的 𝑇1
与 𝑇2
,𝑉
中任意的 𝑥
,域 𝐹
中任意的 𝑘
,有:
(𝑇1+𝑇2)𝑥=𝑇1𝑥+𝑇2𝑥
(𝑘𝑇1)𝑥=𝑘(𝑇1𝑥)
容易验证 𝐿(𝑉)
是 𝐹
上的一个线性空间,即线性变换空间。
对于 𝐿(𝑉)
中的线性变换 𝑇1
与 𝑇2
,定义 𝑇1
与 𝑇2
的乘积 𝑇1𝑇2
为:
(𝑇1𝑇2)𝑥=𝑇2(𝑇1𝑥)
可以验证 (𝑇1𝑇2)
也是 𝐿(𝑉)
中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似。
对于 𝐿(𝑉)
中的线性变换 𝑇1
,如果 𝐿(𝑉)
中的线性变换 𝑇2
,使得对于 𝑉
中任意的向量 𝑥
,有:
(𝑇1𝑇2)𝑥=𝑇1(𝑇2𝑥)=𝑥
则称 𝑇2
是 𝑇1
的逆变换,记作:
𝑇2=𝑇−11
且有:
𝑇1𝑇2=𝑇2𝑇1=𝑇𝑒
定理:设 𝑉
的维数为 𝑛
,𝛼1,⋯,𝛼𝑛
为 𝑉
的一组基,在这组基下线性变换 𝑇1
的矩阵为 𝐴
,𝑇2
的矩阵为 𝐵
,则:
- 线性变换 𝑇1 +𝑇2
的矩阵为 𝐴 +𝐵
- 线性变换的数乘 𝑘𝑇1
的矩阵为 𝑘𝐴
- 线性变换的乘积 𝑇1𝑇2
的矩阵为 𝐴𝐵
- 线性变换 𝑇1
的逆变换若存在,矩阵为 𝐴−1
坐标
设 𝑛
个向量 𝑥
是 𝑛
维空间 𝑉
的一个基,对于 𝑉
中任意的向量 𝑦
,令 𝑦
为:
𝑦=𝑎1𝑥1+𝑎2𝑥2+⋯+𝑎𝑛𝑥𝑛=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
称列向量:
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
为向量 𝑦
在基 𝑥1,𝑥2,⋯,𝑥𝑛
下的 坐标。
可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分。
坐标变换公式
设 𝑉
的维数为 𝑛
,𝐿(𝑉)
中有变换 𝑇
,𝑇
在基 𝛼1,⋯,𝛼𝑛
下的矩阵为 𝐴
。设:
𝜉=(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
且有:
𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
则有:
𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝛼1,⋯,𝛼𝑛)𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
空间 𝑉
中的列向量点本质上都是「基乘坐标」的形式。空间 𝑉
中的列向量点 𝑥
,本身用了单位阵 𝐼
作为基,即 𝑥 =𝐼𝑥
。
只有同一个基,基不动的时候,单纯的线性变换 𝑇
,就是坐标左乘普通矩阵。
把线性变换 𝑇
看成对于空间 𝑉
的一个观测滤镜。线性变换 𝑇
的作用对象是空间 𝑉
,将空间 𝑉
扭曲了。加了滤镜之后,点本身的位置没有变。
这个定理也说明,对于列向量基的线性变换 𝑇
,等价于对于基右乘一个过渡矩阵。
于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵。
过渡矩阵
设 𝑛
个向量 𝑥
与 𝑛
个向量 𝑦
是空间 𝑉
的两组基。对于 1 ≤𝑖 ≤𝑛
,令每个向量 𝑦𝑖
在基 𝑥1,𝑥2,⋯,𝑥𝑛
下的坐标为:
𝑦𝑖=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑖𝑎2𝑖⋮𝑎𝑛𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
于是 𝑛
个向量 𝑦
排成等式左边的矩阵,𝑛
个坐标排成等式右边的矩阵 𝐴
:
(𝑦1,𝑦2,⋯,𝑦𝑛)=(𝑥1,𝑥2,⋯,𝑥𝑛)𝐴
矩阵 𝐴
称为由基 𝑥1,𝑥2⋯,𝑥𝑛
到基 𝑦1,𝑦2⋯,𝑦𝑛
的 过渡矩阵,也称为变换矩阵。
显然过渡矩阵可逆。对于上式,由基 𝑦1,𝑦2⋯,𝑦𝑛
到基 𝑥1,𝑥2⋯,𝑥𝑛
的过渡矩阵为 𝐴−1
。
可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分。
设 𝑛
个向量 𝑥
与 𝑛
个向量 𝑦
是空间 𝑉
的两组基。对于空间 𝑉
中的同一个向量 𝑧
,有:
𝑧=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝑦1,𝑦2⋯,𝑦𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
代入上文的
(𝑦1,𝑦2⋯,𝑦𝑛)=(𝑥1,𝑥2⋯,𝑥𝑛)𝐴
由唯一性,得到:
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
或者
⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴−1⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠
这是纯粹坐标之间的变换,坐标变换公式均在标量域中。由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」。
矩阵可以对整个空间,即全体坐标进行变换,列向量 𝑥
作为坐标遍布整个空间。
单位矩阵 𝐼
由单位向量构成。矩阵 𝐴
会将单位矩阵 𝐼
变换到矩阵 𝐴
的每个列向量,即将单位向量变换到矩阵 𝐴
的每个列向量。因此左乘矩阵 𝐴
,也可以视为将空间做了这样的变换。
向量左乘矩阵,也可以视为坐标左乘向量组。用坐标的观点看待就是:
𝐼𝑦=𝑋𝑎
同一个列向量 𝑦
,在「正常」的空间,单位矩阵 𝐼
代表的空间下,坐标为 𝑦
,在变换后新的空间里,坐标将记为 𝑎
。这样一来,矩阵 𝑋
不仅是正常空间下的一组基,也是从向量组 𝐼
到向量组 𝑋
的过渡矩阵。
线性变换 𝑇
会将一个基映射为另一个基,于是坐标也被映射为另一个坐标。
如果将基 𝛼
映射到 𝛽
对应的线性变换 𝑇
的过渡矩阵是 𝐴
,那么对应的基矩阵就有 𝛽 =𝛼𝐴
。
于是坐标的关系恰好反过来。假设线性变换 𝑇
映射后的坐标是 𝑏
,即加滤镜后观察到坐标 𝑏
,于是点在 𝑉
的表示就是 𝛽𝑏
。还原的办法就是用过渡矩阵,把点在 𝑉
的表示写成 𝛼𝐴𝑏
。于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了。
线性变换与矩阵相似
在空间 𝑉
中的一个线性变换 𝑇
对于空间 𝑉
的基 𝛼
的关系:
线性变换 𝑇
作用于基 𝛼
,将基 𝛼
映射到了 𝑇(𝛼)
,相当于在基 𝛼
右乘一个 𝐴
,即 𝑇(𝛼) =𝛼𝐴
。
矩阵相似考虑的问题是:同一个线性变换 𝑇
,在基 𝛽
的空间 𝑉
中描述为矩阵 𝐵
,在基 𝛼
的空间 𝑉
中描述为矩阵 𝐴
。
如果过渡矩阵为 𝐶
,即 𝛽 =𝛼𝐶
,那么两个描述 𝐵
和 𝐴
之间有怎样的联系。
由于是同一个变换 𝑇
,可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:
𝑇(𝛽)=𝑇(𝛼)𝐶=𝛼𝐴𝐶
线性变换 𝑇
在基 𝛽
视角下仍旧为右乘,基 𝛽
转化到基 𝛼
再右乘一个 𝐶
,变换前后保持过渡矩阵 𝐶
的关系:
𝑇(𝛽)=𝛽𝐵=𝛼𝐶𝐵
于是问题得到解决:
𝐵=𝐶−1𝐴𝐶
定理:设 𝐿(𝑉)
中有变换 𝑇
,则 𝑇
在不同基下的矩阵 相似。
对于方阵 𝐴
和方阵 𝐵
,如果存在可逆矩阵 𝐶
使得 𝐵 =𝐶−1𝐴𝐶
,则 𝐴
和 𝐵
相似。
矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价。但是,等价的两个矩阵未必相似。
由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系。
回过头来,矩阵相似的解释就是 4 个等式:𝛽 =𝛼𝐶
、𝑇(𝛼) =𝛼𝐴
、𝑇(𝛽) =𝛽𝐵
、𝑇(𝛽) =𝑇(𝛼)𝐶
。
参考资料
本页面最近更新:2024/7/3 18:48:56,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:Tiphereth-A, aofall, CCXXXI, CoelacanthusHex, Great-designer, Larry0716, Marcythm, Persdre, shuzhouliu
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用