n 阶矩阵 A 相似于对角阵的充分必要条件是存在 n 个线性无关的列向量 $\xi_1,\cdots,\xi_n$ 和 n 个数 $\lambda_1,\cdots,\lambda_n$ 使得 $$ A\xi_i=\lambda_i\xi_i, \quad i=1,\cdots,n $$
因此,矩阵的相似对角化问题转化为寻求满足 $A\xi=\lambda\xi$ 的 $\xi$ 和 $\lambda$。尽管 $\xi=0$ 一定满足 $A\xi=\lambda\xi$ ,但由于我们最终还要用这些向量来构造可逆矩阵,所以我们考虑是否存在非零向量 $\xi$ 满足 $A\xi=\lambda\xi$
定义 4.3 设 A 为 n 阶矩阵,如果存在数 $\lambda$ 和非零向量 $\xi$,满足 $A\xi=\lambda\xi$,则称 $\lambda$ 为 A 的一个特征值,称 $\xi$ 为 A 的属于特征值 $\lambda$ 的特征向量。
例如,设 $ A= \begin{pmatrix} 1&1\\ 1&1\\ \end{pmatrix} $ , $ \xi= \begin{pmatrix} 1\\ 1\\ \end{pmatrix} $ , 则 $A\xi=2\xi$,可见,2 是 A 的一个特征值,$\xi$ 是属于特征值 2 的一个特征向量。
如果 $A\xi=\lambda\xi,\xi \neq 0$ 那么对任意 k,有 $$ A(k\xi)=k(A\xi)=k(\lambda\xi)=\lambda(k\xi) $$
因此,当 $k \neq 0$ 时,$k\xi$ 也是 A 的属于特征值 $\lambda$ 的特征向量,所以属于特征值 $\lambda$ 的特征向量是不唯一的。
那么如何求 A 的全部特征值与特征向量?下面讨论这一问题。
设 $\lambda_0$ 为 A 的一个特征值,$\xi$ 为属于特征值 $\lambda_0$ 的一个特征向量,即 $A\xi=\lambda_0\xi$,于是 $(\lambda_0E-A)\xi=0,\xi \neq 0$。换句话说,$\xi$ 为 $(\lambda_0E-A)\xi=0$ 的一个非零解,由推论 3.2 可知,$|\lambda_0E-A|=0$
定义 4.4 设 $A=(a_{ij})$ 为 n 阶矩阵,则 $\lambda E-A$ 称为 A 的特征矩阵。 $$ |\lambda E - A|= \begin{vmatrix} \lambda - a_{11} & -a_{12} & \cdots & -a_{1n}\\ -a_{21} & \lambda - a_{22} & \cdots & -a_{2n}\\ \vdots & \vdots & & \vdots \\ -a_{n1} & -a_{n2} & \cdots & \lambda - a_{nn}\\ \end{vmatrix} $$ 称为 A 的特征多项式,$|\lambda E-A|=0$ 称为 A 的特征方程
根据前文的推导可得以下定理。
定理 4.2 设 A 为 n 阶矩阵,则
(1)$\lambda_0$ 为 A 的特征值当且仅当 $\lambda_0$ 是 A 的特征多项式的一个根。
(2)$\xi$ 为 A 的属于特征值 $\lambda_0$ 的一个特征向量当且仅当 $\xi$ 是齐次线性方程组 $(\lambda_0 E - A)x=0$ 的非零解。
由定理 4.2 可知,求特征值与特征向量的方法为:
第一步,计算 A 的特征多项式 $|\lambda E - A|$
第二步,计算 $|\lambda E - A|=0$ 的全部根,这些根就是 A 的全部特征值
第三步,对每一个特征值 $\lambda_i,\; i=1,2,\cdots,n$,求齐次线性方程组 $|\lambda E - A|=0$ 的一个基础解系 $\eta_1,\cdots,\eta_t$,于是 A 的属于 $\lambda_i$ 的全部特征向量为 $k_1\eta_1+\cdots+k_t\eta_t$,其中 $k_1,\cdots,k_t$ 为任意不全为零的数。
这里,我们强调两点,其一是由定义 4.3 知,零向量不是特征向量;其二是实矩阵未必有实的特征值。
设矩阵 $ A= \begin{pmatrix} \frac{\sqrt{2}}{2}&-\frac{\sqrt{2}}{2}\\ \frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\ \end{pmatrix} $ ,那么从几何意义上来看,$A\xi$ 表示平面上把 $\xi$ 逆时针旋转 $\frac{\pi}{4}$ 得到的向量。因此,当 $\xi \neq 0$ 时,$A\xi$ 与 $\xi$ 不共线,换言之,不存在实数 $\lambda$ 使得 $A\xi=\lambda \xi$,所以 A 没有实特征值。事实上,我们也可以从 A 的特征多项式 $\lambda E - A = \lambda^2 - \sqrt{2}\lambda+1$ 看出,$|\lambda E - A|=0$ 没有实根。
示例 4.2 求矩阵 $ A= \begin{pmatrix} 1&2&2\\ 2&1&2\\ 2&2&1\\ \end{pmatrix} $ 的特征值与特征向量。
解 直接计算得 A 的特征多项式
$$ |\lambda E - A|= \begin{vmatrix} \lambda - 1 & -2 & -2\\ -2 & \lambda - 1 & -2\\ -2 & -2 & \lambda -1\\ \end{vmatrix} = (\lambda - 5)(\lambda + 1)^2 $$重根:$(\lambda + 1)^2=(\lambda + 1)(\lambda + 1)$ 对应两个根,$\lambda_1=-1,\lambda_2=-1$
令$|\lambda E - A|=0$,求出 A 的特征值 $\lambda_1=\lambda_2=-1,\lambda_3=5$
对于特征值 $\lambda_1=\lambda_2=-1$,对特征矩阵作初等行变换
$$ \lambda_1 E - A = \begin{pmatrix} -2&-2&-2\\ -2&-2&-2\\ -2&-2&-2\\ \end{pmatrix} \to \begin{pmatrix} 1&1&1\\ 0&0&0\\ 0&0&0\\ \end{pmatrix} $$由此得$(\lambda_1 E - A)x=0$的基础解系
$$ \xi_1=(-1,1,0)^T ,\quad \xi_2=(-1,0,1)^T $$于是,$k_1 \xi_1 + k_2 \xi_2 \; (k_1,k_2 \text{不全为零})$ 为 A 的属于 $\lambda_1=\lambda_2=-1$ 的全部特征向量。
对于特征值 $\lambda_3=5$,对特征矩阵作初等行变换
$$ \lambda_3 E - A = \begin{pmatrix} 4&-2&-2\\ -2&4&-2\\ -2&-2&4\\ \end{pmatrix} \to \begin{pmatrix} 1&0&-1\\ 0&1&-1\\ 0&0&0\\ \end{pmatrix} $$由此得$(\lambda_3 E - A)x=0$的基础解系
$$ \xi_3=(1,1,1)^T $$于是,$k_3 \xi_3 \;(k_3 \neq 0)$ 为 A 的属于 $\lambda_3=5$ 的全部特征向量。
例 4.3 求矩阵 $ A= \begin{pmatrix} 1&1&0\\ 0&1&0\\ 0&0&2\\ \end{pmatrix} $ 的特征值与特征向量
解 矩阵 A 的特征多项式
$$ |\lambda E - A|= \begin{vmatrix} \lambda - 1 & -1 & 0\\ 0 & \lambda - 1 & 0\\ 0 & 0 & \lambda - 2\\ \end{vmatrix} = (\lambda - 1)^2(\lambda - 2) $$令 $|\lambda E - A|=0$,得 A 的特征值 $\lambda_1=\lambda_2=1,\lambda_3=2$
对于 $\lambda_1=\lambda_2=1$,求得 $(E-A)x=0$ 的基础解系
$$ \xi_1=(1,0,0)^T $$于是,$k_1 \xi_1 \;(k_1 \neq 0)$ 为 A 的属于 $\lambda_1=\lambda_2=1$ 的全部特征向量。
对于特征值 $\lambda_3=2$,求得 $(2E - A)x=0$ 的基础解系
$$ \xi_3=(0,0,1)^T $$于是,$k_3 \xi_3 \; (k_3 \neq 0)$ 为 A 的属于 $\lambda_3=2$ 的全部特征向量。
例 4.4 设 $\lambda$ 为 n 阶矩阵 A 的一个特征值,$\xi$ 为相应的特征向量。若 P 为 n 阶可逆矩阵,求 $P^{-1}AP$ 的一个特征值及相应的特征向量。
解 由假设知,$A\xi=\lambda \xi$,那么,两边左乘 $P^{-1}$ 得
$$ P^{-1}A\xi=P^{-1}(\lambda \xi)=\lambda P^{-1} \xi $$于是
$$ P^{-1}AP(P^{-1}\xi)=P^{-1}(A\xi)=\lambda (P^{-1}\xi) $$由此可见 $\lambda$ 为 $P^{-1}AP$ 的一个特征值,$P^{-1}\xi$ 为相应的特征向量。
例 4.5 设 $\lambda$ 为 n 阶矩阵 A 的特征值,证明 $\varphi(\lambda)$ 为 $\varphi(A)$ 的特征值,其中 $\varphi(x)=a_mx^m+\cdots+a_1x+a_0$
证明 设 $\xi$ 是 A 的属于特征值 $\lambda$ 的特征向量,即 $\xi \neq 0$ 而且
$$ A\xi=\lambda \xi $$由此可得
$$ A^s\xi=A^{s-1}(A\xi)=A^{s-1}(\lambda \xi)=\lambda A^{s-1}\xi=\cdots=\lambda^s\xi $$故
$$ \begin{flalign} \varphi(A)\xi&=(a_mA^m+\cdots+a_1A+a_0E)\xi \\ &=a_mA^m\xi+\cdots+a_1A\xi+a_0E\xi\\ &=a_m \lambda^m\xi+\cdots+a_1 \lambda\xi+a_0\xi\\ &=(a_m \lambda^m+\cdots+a_1 \lambda+a_0)\xi\\ &=\varphi(\lambda)\xi \\ \end{flalign} $$可见,$\varphi(\lambda)$ 是 $\varphi(A)$ 的特征值,$\xi$ 是 $\varphi(A)$ 的属于特征值 $\varphi(\lambda)$ 的特征向量。
下面我们来看矩阵特征值的一些性质。
性质 4.7 相似矩阵有相同的特征多项式,因此有相同的特征值。
证明 设矩阵 A,B 相似,即存在可逆矩阵 P,使得 $B=P^{-1}AP$,因而有
$$ \begin{flalign} |\lambda E - B| &= |\lambda E - P^{-1}AP| = |P^{-1}(\lambda E - A)P| \\ &=|P^{-1}||\lambda E - A||P| \\ &=|P|^{-1}|\lambda E - A||P| \\ &=|\lambda E - A| \end{flalign} $$故 A,B 的特征多项式相同,从而 A,B 的特征值相同。
值得注意的是,特征多项式相同的矩阵未必相似。例如
$$ A= \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} ,\quad E= \begin{pmatrix} 1&0\\ 0&1\\ \end{pmatrix} $$则 A 与 E 的特征多项式都是 $(\lambda -1)^2$,但是 A 与 E 不相似。若 A 与 E 相似,即存在可逆矩阵 P 使得 $P^{-1}AP=E$。由此可得 $A=PEP^{-1}=PP^{-1}=E$,但是上面的 A 与 E 并不相等。此矛盾表明 A 与 E 不相似。从上述推导过程还可以看出,与单位矩阵 E 相似的矩阵只有 E 本身。
性质 4.8 设 n 阶矩阵 $A=(a_{ij})$ 的特征值为 $\lambda_1,\cdots,\lambda_n$,则
(1)$\lambda_1 + \cdots + \lambda_n=tr(A)$;
(2)$\lambda_1 \cdots \lambda_n=|A|$
证明 一方面,
$$ \begin{flalign} |\lambda E - A|&= \begin{vmatrix} \lambda - a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda - a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ -a_{n1} & -a_{n2} & \cdots & \lambda - a_{nn} \\ \end{vmatrix} \\ &=(\lambda - a_{11})\cdots (\lambda - a_{nn}) + \cdots \\ &=\lambda^n - (a_{11} + \cdots + a_{nn}) \lambda^{n-1} + \cdots + (-1)^n |A| \end{flalign} $$另一方面,
$$ \begin{flalign} |\lambda E - A| &= (\lambda - \lambda_1) \cdots (\lambda - \lambda_n) \\ &=\lambda^n - (\lambda_1 + \cdots + \lambda_n) \lambda^{n-1} + \cdots + (-1)^n \lambda_1 \cdots \lambda_n \end{flalign} $$比较 $\lambda^{n-1}$ 的系数和常数项得
$$ \lambda_1 + \cdots + \lambda_n = a_{11} + \cdots + a_{nn} = tr(A), \quad \lambda_1 \cdots \lambda_n = |A| $$例 4.6 设 2 阶矩阵 A 的特征值为 2 和 1,求 |A + 2E|
解 令 f(x)=x + 2。因为 2 和 1 是矩阵 A 的特征值,由例4.5可知 f(2) 和 f(1) 是 f(A) 的特征值,即 4 和 3 是 A+2E 的特征值。而 A+2E 是 2 阶矩阵,故 4 和 3 是 A+2E 的全部特征值。
由性质4.8(2)可知 |A+2E|=4x3=12
推论 4.1 n 阶矩阵 A 可逆的充分必要条件为 A 的每个特征值均非零。
性质 4.9 n 阶矩阵 A 与它的转置矩阵 $A^T$ 有相同的特征值。
证明 由 $|\lambda E - A^T| = |(\lambda E - A)^T| = |\lambda E - A|$ 即得。