可对角化矩阵是
线性代数和
矩阵论中重要的一类矩阵。如果一个
方块矩阵 A 相似于
对角矩阵,也就是说,如果存在一个
可逆矩阵 P 使得 P −1AP 是对角矩阵,则它就被称为可对角化的。如果 V 是有限维度的
向量空间,则
线性映射 T : V → V 被称为可对角化的,如果存在 V 的一个基,T 关于它可被表示为对角矩阵。对角化是找到可对角化矩阵或映射的相应对角矩阵的过程。
定义
如果一个矩阵与一个对角矩阵相似,我们就称这个矩阵可经相似变换对角化,简称可对角化;与之对应的线性变换就称为可对角化的线性变换。
任取 ,则 可作为上n维线性空间V的某个线性变换 在一组基 下的矩阵。
若 可对角化,即 使 成对角形,则B是 在另一组基 下的矩阵,且 ,记B的主对角线元素为 ,这是的全部特征值,也是 的全部特征值(因为两矩阵相似),由线性变换的矩阵的定义知
所以, 是 的n个线性无关的特征向量,它们在基向量组 下的坐标 ,即T的列向量组,就是 的n个线性无关的特征向量。
反过来,如果 有n个线性无关的特征向量 ,与它们对应的特征值是 ,以 为列向量组作成一个可逆矩阵T,令 ,就得到 的n个线性无关的特征向量 ,用 作为V的基,则上述方程组成立,从而 在这组基下的矩阵是对角矩阵,并且 。
性质定理
定理1
m级矩阵 或n维线性空间V的线性变换 可对角化的充要条件是或 有n个线性无关的特征向量。当可对角化时,与它相似的对角矩阵的主对角线上的元素就是的全部特征值。
由上面的分析还知道,如果求出了矩阵的n个线性无关的特征向量,那么用这些向量作列向量的矩阵T就使 成对角形,其主对角线上的元素就是的全部特征值(按对应的特征向量排序)。
定理2
属于不同特征值的特征向量线性无关。
证明: 设 是线性变换 的m个不同的特征值, 的属于它们的特征向量分别是 ,下面用数学归纳法证明 线性无关。
(1)当 时,因为特征向量 ,它一定线性无关。
(2)假定 时, 线性无关。
当 时,令
①
用 对两边作用得
②
①式两边乘以 得
③
从②减去③得
由归纳假设得
因为 ,所以 ,将它们代入①得 ,于是 也线性无关。
用取代 的位置上述推理过程一样正确,故定理得证。
在
特征值和特征向量方面,矩阵与线性变换的理论是平行的,下面只就矩阵进行讨论,所得的结果对线性变换也成立。
推论1
若 有n个不同的特征值,则可对角化。
因为复数域上的n次多项式恰有n个根,所以我们还有下面的推论。
推论2
如果的特征多项式在复数域上的根互不相等,那么作为复数域上的矩阵一定可以对角化。
推论3
如果 是 的所有互不相同的特征值,各
特征子空间 的基排列如下:
那么上述特征向量组线性无关,从而特征子空间的和是直和。
定理3
矩阵 可对角化的充要条件是 可以表为A的特征子空间的直和。
证明: 若可对角化,根据定理1,它有n个线性无关的特征向量,将它们按所属的特征值进行分组得到特征向量组
其中子组 中各向量同属特征值 ,它们一定是A的特征子空间 的基(否则将不构成所在特征子空间的基的各子组扩充成所在特征子空间的基,由推论3知,A的线性无关的特征向量的个数大于n,这与 矛盾),于是
反过来,设 ,从各个特征子空间取出一组基就得到的n个线性无关的特征向量,故可对角化。
定理4
矩阵 可对角化的充要条件是A的特征多项式在上可以分解为
的形式,并且特征子空间 的维数 。