文章目录
版权声明
本文大部分内容皆来自李永乐老师考研教材和视频课。
补充知识
求和公式的性质
- ∑ i = 1 n k a i = k ∑ i = 1 n a i \sum_{i=1}^nka_i=k\sum_{i=1}^na_i i=1∑nkai=ki=1∑nai
- ∑ i = 1 n ( a i + b i ) = ∑ i = 1 n a i + ∑ i = 1 n b i \sum_{i=1}^n(a_i+b_i)=\sum_{i=1}^na_i+\sum_{i=1}^nb_i i=1∑n(ai+bi)=i=1∑nai+i=1∑nbi
- ∑ i = 1 m ∑ j = 1 n a i j = ∑ j = 1 n ∑ i = 1 m a i j \sum_{i=1}^m\sum_{j=1}^na_{ij}=\sum_{j=1}^n\sum_{i=1}^ma_{ij} i=1∑mj=1∑naij=j=1∑ni=1∑maij
常用希腊字符读音
- α \alpha α:/ælfə/
- β \beta β:/betə/
- Γ \Gamma Γ、 γ \gamma γ:/gama/
- Δ \Delta Δ、 δ \delta δ:/deltə/
- ε \varepsilon ε:/epsilon/
- υ \upsilon υ:/apsilon/
- θ \theta θ:/θitə/
- π \pi π:/paɪ/
- η \eta η:/ita/
- Λ \Lambda Λ、 λ \lambda λ:/læmdə/
- μ \mu μ:/mju/
- ξ \xi ξ:/ksi/
- Σ \Sigma Σ、 σ \sigma σ:/sigmə/
- τ \tau τ:/taʊ/
- Φ \varPhi Φ、 φ \varphi φ:/faɪ/
- ψ \psi ψ:/psi/
- Ω \Omega Ω、 ω \omega ω:/omiga/
- ρ \rho ρ:/ru:/
特征值和特征向量
设
A
=
[
a
i
j
]
A=[a_{ij}]
A=[aij]为一个
n
n
n阶矩阵,如果存在一个数
λ
\lambda
λ及非零的
n
n
n维向量
α
\alpha
α,使得
A
α
=
λ
α
①
\tag*{①} A\alpha=\lambda\alpha
Aα=λα①
成立,则称
λ
\lambda
λ是矩阵
A
A
A的一个特征值,称非零向量
α
\alpha
α是矩阵
A
A
A属于特征值
λ
\lambda
λ的一个特征向量。则行列式
∣
λ
E
−
A
∣
=
∣
λ
−
a
11
−
a
12
…
−
a
1
n
−
a
21
λ
−
a
22
…
−
a
2
n
⋮
⋮
⋮
−
a
n
1
−
a
n
2
…
λ
−
a
n
n
∣
|\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&\dots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\dots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\dots&\lambda-a_{nn} \end{vmatrix}
∣λE−A∣=
λ−a11−a21⋮−an1−a12λ−a22⋮−an2………−a1n−a2n⋮λ−ann
称为矩阵
A
A
A的特征多项式,
∣
λ
E
−
A
∣
=
0
|\lambda E-A|=0
∣λE−A∣=0称为
A
A
A的特征方程。由①可知
(
λ
E
−
A
)
α
=
O
,
α
≠
O
②
\tag*{②}(\lambda E-A)\alpha=O,\alpha\neq O
(λE−A)α=O,α=O②
即
α
\alpha
α是方程②的非零解,那么求特征向量的步骤如下:
- (1)先由特征方程求出矩阵 A A A的特征值 λ \lambda λ,共 n n n个。
- (2)再由②求基础解系,即矩阵 A A A属于特征值 λ i \lambda_i λi的线性无关的特征向量。
特征值的性质如下:
- 如果
α
\alpha
α是矩阵
A
A
A针对于特征值
λ
\lambda
λ的特征向量,那么只要
k
≠
0
k\neq0
k=0,则
k
α
k\alpha
kα仍是
A
A
A针对于特征值
λ
\lambda
λ的特征向量。
证明:
A α = λ α A ( k α ) = k A α = k ( λ α ) = λ ( k α ) A\alpha=\lambda\alpha\\ A(k\alpha)=kA\alpha=k(\lambda\alpha)=\lambda(k\alpha) Aα=λαA(kα)=kAα=k(λα)=λ(kα) - 如果
α
1
,
α
2
…
,
α
t
\alpha_1,\alpha_2\dots,\alpha_t
α1,α2…,αt都是属于矩阵
A
A
A的特征值
λ
\lambda
λ的特征向量,那么当
k
1
α
1
+
k
2
α
2
+
⋯
+
k
t
α
t
k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t
k1α1+k2α2+⋯+ktαt非零时,
k
1
α
1
+
k
2
α
2
+
⋯
+
k
t
α
t
k_1\alpha_1+k_2\alpha_2+\dots+k_t\alpha_t
k1α1+k2α2+⋯+ktαt仍然是属于矩阵
A
A
A的特征值
λ
\lambda
λ的特征向量。
证明:由 A α 1 = λ α 1 , A α 2 = λ α 2 A\alpha_1=\lambda\alpha_1,A\alpha_2=\lambda\alpha_2 Aα1=λα1,Aα2=λα2得:
A ( k 1 α 1 + k 2 α 2 ) = k 1 A α 1 + k 2 A α 2 = k 1 ( λ α 1 ) + k 2 ( λ α 2 ) = λ ( k 1 α 1 + k 2 α 2 2 ) A(k_1\alpha_1+k_2\alpha_2)=k_1A\alpha_1+k_2A\alpha_2=k_1(\lambda\alpha_1)+k_2(\lambda\alpha_2)=\lambda(k_1\alpha_1+k_2\alpha_22) A(k1α1+k2α2)=k1Aα1+k2Aα2=k1(λα1)+k2(λα2)=λ(k1α1+k2α22) - 设
A
A
A是
n
n
n阶矩阵,
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1,\lambda_2,\dots,\lambda_n
λ1,λ2,…,λn是矩阵
A
A
A的特征值,则:
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
证明:设三阶矩阵 A A A,则有
∣ λ E − A ∣ = ∣ λ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ − a 12 − a 13 0 λ − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 λ − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ = ∣ λ 0 − a 13 0 λ − a 23 0 0 λ − a 33 ∣ + ∣ λ − a 12 − a 13 0 − a 22 − a 23 0 − a 32 λ − a 33 ∣ + ∣ − a 11 0 − a 13 − a 21 λ − a 23 − a 31 0 λ − a 33 ∣ + ∣ − a 11 − a 12 − a 13 − a 21 − a 22 − a 23 − a 31 − a 32 λ − a 33 ∣ … = λ 3 − ( a 11 + a 22 + a 33 ) λ 2 + S λ − ∣ A ∣ = ( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) |\lambda E-A|= \begin{vmatrix} \lambda-a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&\lambda-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&\lambda-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ = \begin{vmatrix} \lambda&0&-a_{13}\\ 0&\lambda&-a_{23}\\ 0&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} \lambda&-a_{12}&-a_{13}\\ 0&-a_{22}&-a_{23}\\ 0&-a_{32}&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&0&-a_{13}\\ -a_{21}&\lambda&-a_{23}\\ -a_{31}&0&\lambda-a_{33} \end{vmatrix} {+} \begin{vmatrix} -a_{11}&-a_{12}&-a_{13}\\ -a_{21}&-a_{22}&-a_{23}\\ -a_{31}&-a_{32}&\lambda-a_{33} \end{vmatrix}\\ \dots\\ =\lambda^3-(a_{11}+a_{22}+a_{33})\lambda^2+S\lambda-|A|\\ =(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3) ∣λE−A∣= λ−a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ00−a12λ−a22−a32−a13−a23λ−a33 + −a11−a21−a31−a12λ−a22−a32−a13−a23λ−a33 = λ000λ0−a13−a23λ−a33 + λ00−a12−a22−a32−a13−a23λ−a33 + −a11−a21−a310λ0−a13−a23λ−a33 + −a11−a21−a31−a12−a22−a32−a13−a23λ−a33 …=λ3−(a11+a22+a33)λ2+Sλ−∣A∣=(λ−λ1)(λ−λ2)(λ−λ3)
设特征方程的解为 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3,那么
( λ − λ 1 ) ( λ − λ 2 ) ( λ − λ 3 ) = λ 3 − ( λ 1 + λ 2 + λ 3 ) λ 2 + S λ − λ 1 λ 2 λ 3 (\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)=\lambda^3-(\lambda_1+\lambda_2+\lambda_3)\lambda^2+S\lambda-\lambda_1\lambda_2\lambda_3 (λ−λ1)(λ−λ2)(λ−λ3)=λ3−(λ1+λ2+λ3)λ2+Sλ−λ1λ2λ3
所以
∑ λ i = ∑ a i i , ∏ λ i = ∣ A ∣ \sum\lambda_i=\sum a_{ii},\prod\lambda_i=|A| ∑λi=∑aii,∏λi=∣A∣
其中 S S S为一次项的系数,不重要。 - 如果
λ
1
,
λ
2
,
…
,
λ
m
\lambda_1,\lambda_2,\dots,\lambda_m
λ1,λ2,…,λm是矩阵
A
A
A的互不相同的特征值,
α
1
,
α
2
…
,
α
m
\alpha_1,\alpha_2\dots,\alpha_m
α1,α2…,αm分别是与之对应的特征向量,则
α
1
,
α
2
…
,
α
m
\alpha_1,\alpha_2\dots,\alpha_m
α1,α2…,αm线性无关。
证明:对特征值的个数 m m m做数学归纳法,当 m = 1 m=1 m=1时, α 1 ≠ O \alpha_1\neq O α1=O,命题正确。设 m = k − 1 m=k-1 m=k−1时命题正确,当 m = k m=k m=k时,设
x 1 α 1 + x 2 α 2 + ⋯ + x k − 1 α k − 1 + x k α k = O ① \tag*{①}x_1\alpha_1+x_2\alpha_2+\dots+x_{k-1}\alpha_{k-1}+x_k\alpha_k=O x1α1+x2α2+⋯+xk−1αk−1+xkαk=O①
用 A A A左乘上式有
x 1 λ 1 α 1 + x 2 λ 2 α 2 + ⋯ + x k − 1 λ k − 1 α k − 1 + x k λ k α k = O ② \tag*{②}x_1\lambda_1\alpha_1+x_2\lambda_2\alpha_2+\dots+x_{k-1}\lambda_{k-1}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λ1α1+x2λ2α2+⋯+xk−1λk−1αk−1+xkλkαk=O②
用 λ k \lambda_k λk乘①得
x 1 λ k α 1 + x 2 λ k α 2 + ⋯ + x k − 1 λ k α k − 1 + x k λ k α k = O ③ \tag*{③}x_1\lambda_k\alpha_1+x_2\lambda_k\alpha_2+\dots+x_{k-1}\lambda_{k}\alpha_{k-1}+x_k\lambda_k\alpha_k=O x1λkα1+x2λkα2+⋯+xk−1λkαk−1+xkλkαk=O③
② − - −③得
x 1 ( λ 1 − λ k ) α 1 + x 2 ( λ 2 − λ k ) α 2 + ⋯ + x k − 1 ( λ k − 1 − λ k ) α k − 1 = O x_1(\lambda_1-\lambda_k)\alpha_1+x_2(\lambda_2-\lambda_k)\alpha_2+\dots+x_{k-1}(\lambda_{k-1}-\lambda_k)\alpha_{k-1}=O x1(λ1−λk)α1+x2(λ2−λk)α2+⋯+xk−1(λk−1−λk)αk−1=O
由归纳假设结论得
x 1 = 0 , x 2 = 0 , … , x k − 1 = 0 x_1=0,x_2=0,\dots,x_{k-1}=0 x1=0,x2=0,…,xk−1=0
代入①得
x k α k = O x_k\alpha_k=O xkαk=O
所以 x k = 0 x_k=0 xk=0,因此 α 1 , α 2 … , α m \alpha_1,\alpha_2\dots,\alpha_m α1,α2…,αm线性无关。 - 如果 A A A是 n n n阶矩阵, λ \lambda λ是 A A A的 m m m重特征值,则属于 λ \lambda λ的线性无关的特征向量最多有 m m m个。
相似矩阵
设
A
,
B
A,B
A,B都是
n
n
n阶矩阵,如果存在可逆矩阵
P
P
P,使得
P
−
1
A
P
=
B
P^{-1}AP=B
P−1AP=B
则称矩阵
A
A
A和
B
B
B相似,记作
A
∼
B
A\thicksim B
A∼B
相似矩阵的性质如下:
- A ∼ A A\thicksim A A∼A
- A ∼ B ⇔ B ∼ A A\thicksim B\Leftrightarrow B\thicksim A A∼B⇔B∼A
-
A
∼
B
,
B
∼
A
⇒
A
∼
C
A\thicksim B,B\thicksim A\Rightarrow A\thicksim C
A∼B,B∼A⇒A∼C
证明:设 P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P1−1AP1=B,P2−1BP2=C则
P 2 − 1 ( P 1 − 1 A P 1 ) P 2 = C P_2^{-1}(P_1^{-1}AP_1)P_2=C P2−1(P1−1AP1)P2=C
令 P = P 1 P 2 P=P_1P_2 P=P1P2,有 P − 1 = ( P 1 P 2 ) − 1 = P 2 − 1 P 1 − 1 P^{-1}=(P_1P_2)^{-1}=P_2^{-1}P_1^{-1} P−1=(P1P2)−1=P2−1P1−1所以 P − 1 A P = C P^{-1}AP=C P−1AP=C。 - 如果
A
∼
B
A\thicksim B
A∼B,那么
- A 2 ∼ B 2 A^2\thicksim B^2 A2∼B2
- A + k E ∼ B + k E A+kE\thicksim B+kE A+kE∼B+kE
- 如果 A A A可逆,则 A − 1 ∼ B − 1 A^{-1}\thicksim B^{-1} A−1∼B−1
- A 1 ∼ B 1 , A 2 ∼ B 2 ⇒ [ A 1 A 2 ] ∼ [ B 1 B 2 ] A_1\thicksim B_1,A_2\thicksim B_2 \Rightarrow\begin{bmatrix}A_1&\\&A_2\end{bmatrix}\thicksim\begin{bmatrix}B_1&\\&B_2\end{bmatrix} A1∼B1,A2∼B2⇒[A1A2]∼[B1B2]
-
A
∼
B
⇒
r
(
A
)
=
r
(
B
)
A\thicksim B\Rightarrow r(A)=r(B)
A∼B⇒r(A)=r(B)
证明:
r ( B ) = r ( P − 1 A P ) = r ( A P ) = r ( A ) r(B)=r(P^{-1}AP)=r(AP)=r(A) r(B)=r(P−1AP)=r(AP)=r(A) -
A
∼
B
⇒
∣
A
∣
=
∣
B
∣
A\thicksim B\Rightarrow |A|=|B|
A∼B⇒∣A∣=∣B∣
证明:
∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ A ∣ |B|=|P^{-1}AP|=|P^{-1}||A||P|=|A| ∣B∣=∣P−1AP∣=∣P−1∣∣A∣∣P∣=∣A∣ -
A
∼
B
⇒
∣
λ
E
−
A
∣
=
∣
λ
E
−
B
∣
A\thicksim B\Rightarrow |\lambda E-A|=|\lambda E-B|
A∼B⇒∣λE−A∣=∣λE−B∣
证明:
∣ λ E − B ∣ = ∣ λ E − P − 1 A P ∣ = ∣ P − 1 ( λ E − A ) P ∣ = ∣ P − 1 ∣ ∣ λ E − A ∣ ∣ P ∣ = ∣ λ E − A ∣ |\lambda E-B|=|\lambda E-P^{-1}AP|=|P^{-1}(\lambda E-A)P|=|P^{-1}||\lambda E-A||P|=|\lambda E-A|\\ ∣λE−B∣=∣λE−P−1AP∣=∣P−1(λE−A)P∣=∣P−1∣∣λE−A∣∣P∣=∣λE−A∣
相似对角化
如果
A
A
A能与对角矩阵相似,则称
A
A
A可对角化。
P
−
1
A
P
=
Λ
A
P
=
P
Λ
P^{-1}AP=\Lambda\\ AP=P\Lambda
P−1AP=ΛAP=PΛ
假设
A
A
A是三阶矩阵,对
P
P
P按列分块:
A
(
p
1
,
p
2
,
p
3
)
=
(
p
1
,
p
2
,
p
3
)
[
λ
1
λ
2
λ
3
]
[
A
p
1
,
A
p
2
,
A
p
3
]
=
[
λ
1
p
1
,
λ
2
p
2
,
λ
3
p
3
]
⇓
A
p
1
=
λ
1
p
1
,
A
p
2
=
λ
2
p
2
,
A
p
3
=
λ
3
p
3
A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}\\ [Ap_1,Ap_2,Ap_3]=[\lambda_1p_1,\lambda_2p_2,\lambda_3p_3]\\ \Downarrow\\ Ap_1=\lambda_1p_1,Ap_2=\lambda_2p_2,Ap_3=\lambda_3p_3
A(p1,p2,p3)=(p1,p2,p3)
λ1λ2λ3
[Ap1,Ap2,Ap3]=[λ1p1,λ2p2,λ3p3]⇓Ap1=λ1p1,Ap2=λ2p2,Ap3=λ3p3
那么:
- A A A的特征值: λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3
- A A A的特征向量: p 1 , p 2 , p 3 p_1,p_2,p_3 p1,p2,p3
因为
P
P
P可逆,所以
p
1
,
p
2
,
p
3
p_1,p_2,p_3
p1,p2,p3线性无关。反之,若
A
A
A有
3
3
3个无关的特征向量
p
1
,
p
2
,
p
3
p_1,p_2,p_3
p1,p2,p3,满足
A
p
i
=
λ
i
p
i
(
i
=
1
,
2
,
3
)
Ap_i=\lambda_ip_i(i=1,2,3)
Api=λipi(i=1,2,3),则有
A
(
p
1
,
p
2
,
p
3
)
=
(
p
1
,
p
2
,
p
3
)
[
λ
1
λ
2
λ
3
]
A(p_1,p_2,p_3)=(p_1,p_2,p_3) \begin{bmatrix} \lambda_1&&\\ &\lambda_2&\\ &&\lambda_3\\ \end{bmatrix}
A(p1,p2,p3)=(p1,p2,p3)
λ1λ2λ3
令
P
=
[
p
1
,
p
2
,
p
3
]
,
Λ
=
[
λ
1
λ
2
λ
3
]
P=[p_1,p_2,p_3],\Lambda=\begin{bmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\\\end{bmatrix}
P=[p1,p2,p3],Λ=
λ1λ2λ3
,则
P
−
1
A
P
=
Λ
P^{-1}AP=\Lambda
P−1AP=Λ
矩阵对角化的性质如下:
-
n
n
n阶矩阵
A
A
A可对角化
⇔
A
\Leftrightarrow A
⇔A有
n
n
n个线性无关的特征向量,且
A ∼ [ λ 1 λ 2 ⋱ λ n ] A\thicksim \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} A∼ λ1λ2⋱λn - n n n阶矩阵 A A A可对角化 ⇔ \Leftrightarrow ⇔ λ i \lambda_i λi是 A A A的 n i n_i ni重特征值,则 λ i \lambda_i λi有 n i n_i ni个线性无关的特征向量 ⇔ \Leftrightarrow ⇔秩 r ( λ E − A ) = n − n i r(\lambda E-A)=n-n_i r(λE−A)=n−ni, λ i \lambda_i λi为 n i n_i ni重特征值。
实对称矩阵
满足以下两个条件的方阵称为实对称矩阵:
- A = A T A=A^T A=AT
- 矩阵的元素全为实数。
实对称矩阵的性质如下:
- 若矩阵
A
A
A是实对称矩阵,则
A
A
A的特征值都是实数。
证明:设 A α = λ α A\alpha=\lambda \alpha Aα=λα,则
A α ˉ = λ α ˉ A ˉ α ˉ = λ ˉ α ˉ \bar{A\alpha}=\bar{\lambda\alpha}\\ \bar{A}\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\ Aαˉ=λαˉAˉαˉ=λˉαˉ
因为 A A A是实对称矩阵,所以 A ˉ = A \bar{A}=A Aˉ=A
A α ˉ = λ ˉ α ˉ α T A α ˉ = λ ˉ α T α ˉ A\bar{\alpha}=\bar{\lambda}\bar{\alpha}\\\ \alpha^TA\bar{\alpha}=\bar{\lambda}\alpha^T\bar{\alpha}\\ Aαˉ=λˉαˉ αTAαˉ=λˉαTαˉ
因为 α T A α ˉ \alpha^TA\bar{\alpha} αTAαˉ与 α T α ˉ \alpha^T\bar{\alpha} αTαˉ都是数,所以:
α T A α ˉ = ( α T A α ˉ ) T = λ α ˉ T α = λ α T α ˉ α T α ˉ = ( α T α ˉ ) T = α ˉ T α ⇓ ( λ − λ ˉ ) α T α ˉ = 0 \alpha^TA\bar{\alpha}=(\alpha^TA\bar{\alpha})^T=\lambda\bar{\alpha}^T\alpha=\lambda\alpha^T\bar{\alpha}\\ \alpha^T\bar{\alpha}=(\alpha^T\bar{\alpha})^T=\bar{\alpha}^T\alpha\\ \Downarrow\\ (\lambda-\bar{\lambda})\alpha^T\bar{\alpha}=0 αTAαˉ=(αTAαˉ)T=λαˉTα=λαTαˉαTαˉ=(αTαˉ)T=αˉTα⇓(λ−λˉ)αTαˉ=0
因为 α ≠ O \alpha\neq O α=O,所以 α T α ˉ > 0 \alpha^T\bar{\alpha}>0 αTαˉ>0,因此 λ = λ ˉ \lambda=\bar{\lambda} λ=λˉ - 实对称矩阵
A
A
A的不同特征值
λ
1
,
λ
2
\lambda_1,\lambda_2
λ1,λ2所对应的特征向量
α
1
,
α
2
\alpha_1,\alpha_2
α1,α2必正交。
证明:由 A α 1 = λ 1 α 2 , A α 2 = λ 2 α 2 , λ 1 = λ 2 A\alpha_1=\lambda_1\alpha_2,A\alpha_2=\lambda_2\alpha_2,\lambda_1=\lambda_2 Aα1=λ1α2,Aα2=λ2α2,λ1=λ2得:
λ 1 α 2 α 1 = α 1 T A α 1 = α 2 T A T α 1 = ( A α 2 ) T α 1 = ( λ 2 α 2 ) T α 1 = λ 2 α 2 T α 1 ⇓ ( λ 1 − λ 2 ) α 2 T α 1 = 0 \lambda_1\alpha_2\alpha_1=\alpha_1^TA\alpha_1=\alpha_2^TA^T\alpha_1=(A\alpha_2)^T\alpha_1=(\lambda_2\alpha_2)^T\alpha_1=\lambda_2\alpha_2^T\alpha_1\\ \Downarrow\\ (\lambda_1-\lambda_2)\alpha_2^T\alpha_1=0\\ λ1α2α1=α1TAα1=α2TATα1=(Aα2)Tα1=(λ2α2)Tα1=λ2α2Tα1⇓(λ1−λ2)α2Tα1=0
因为 λ 1 ≠ λ 2 \lambda_1\neq\lambda_2 λ1=λ2,所以 α 2 T α 1 = 0 \alpha_2^T\alpha_1=0 α2Tα1=0 -
n
n
n阶实对称矩阵
A
A
A必可对角化,且总存在正交矩阵
Q
Q
Q,使得
Q − 1 A Q = Q T A Q = [ λ 1 λ 2 ⋱ λ n ] Q^{-1}AQ=Q^TAQ= \begin{bmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{bmatrix} Q−1AQ=QTAQ= λ1λ2⋱λn
其中 λ 1 , λ 2 , … , λ n \lambda_1,\lambda_2,\dots,\lambda_n λ1,λ2,…,λn是 A A A的特征值。
证明:对 n n n用数学归纳法,当 n = 1 n=1 n=1时,命题显然成立。假设 n − 1 n-1 n−1时命题成立,对于 n n n阶矩阵 A A A,设 λ 1 \lambda_1 λ1是 A A A的特征值, α 1 \alpha_1 α1是对应于 λ 1 \lambda_1 λ1的单位特征向量,将 α 1 \alpha_1 α1扩充为 R n R^n Rn的一组规范正交基: α 1 , α 2 … , α n \alpha_1,\alpha_2\dots,\alpha_n α1,α2…,αn,即 [ α 1 , α 2 … , α n ] [\alpha_1,\alpha_2\dots,\alpha_n] [α1,α2…,αn]是 n n n阶正交矩阵。由 A α 1 = λ 1 α 1 A\alpha_1=\lambda_1\alpha_1 Aα1=λ1α1,并设
A α 2 = b 12 α 1 + b 22 α 2 + ⋯ + b n 2 α n … A α n = b 1 n α 1 + b 2 n α 2 + ⋯ + b n n α n A\alpha_2=b_{12}\alpha_1+b_{22}\alpha_2+\dots+b_{n2}\alpha_n\\ \dots\\ A\alpha_n=b_{1n}\alpha_1+b_{2n}\alpha_2+\dots+b_{nn}\alpha_n Aα2=b12α1+b22α2+⋯+bn2αn…Aαn=b1nα1+b2nα2+⋯+bnnαn