内容总结:
- A x = b Ax=b Ax=b的通解: x x x=(一个特解 x p x_p xp)+(所有在零空间的 x n x_n xn)
- 增广矩阵 [ A b ] \begin{bmatrix}A&b\end{bmatrix} [Ab]经过消元为 [ R d ] \begin{bmatrix}R&d\end{bmatrix} [Rd],那么方程 A x = b Ax=b Ax=b等价于 R x = d Rx=d Rx=d
- A x = b Ax=b Ax=b和 R x = d Rx=d Rx=d只有当 R R R的所有零行在对应的 d d d中有零值
- A A A列满秩, r = n r=n r=n,等价于 N ( A ) N(A) N(A)=零向量,等价于没有自由变量
- A A A行满秩, r = m r=m r=m,等价于 C ( A ) C(A) C(A)是 R m R^m Rm, A x = b Ax=b Ax=b总是可解
- 四种情况。 r = m = n r=m=n r=m=n(可逆)、 r = m < n r=m<n r=m<n(所有 A x = b Ax=b Ax=b总是可解)、 r = n < m r=n<m r=n<m( A x = b Ax=b Ax=b有0个或者1个解)和 r < m , r < n r<m,r<n r<m,r<n(0个或者无穷多个解)
一、 A x = b Ax=b Ax=b进行RREF
上一节课,我们解决了 A x = 0 Ax=0 Ax=0解的问题,这个问题被由最后的 R x = 0 Rx=0 Rx=0解决,这一节我们讨论更加一般的情况 A x = b Ax=b Ax=b。
[
1
3
0
2
0
0
1
4
1
3
1
6
]
[
x
1
x
2
x
3
x
4
]
=
[
1
6
7
]
\begin{bmatrix} 1 &3&0&2\\ 0&0&1&4\\ 1&3&1&6 \end{bmatrix}\begin{bmatrix} x_1\\x_2\\x_3\\x_4 \end{bmatrix} =\begin{bmatrix} 1\\6\\7 \end{bmatrix}
⎣⎡101303011246⎦⎤⎣⎢⎢⎡x1x2x3x4⎦⎥⎥⎤=⎣⎡167⎦⎤
四个未知数,三个方程。写成增广矩阵形式:
[
1
3
0
2
1
0
0
1
4
6
1
3
1
6
7
]
\begin{bmatrix} 1 &3&0&2&1\\ 0&0&1&4&6\\ 1&3&1&6&7 \end{bmatrix}
⎣⎡101303011246167⎦⎤
化简成RREF形式:
[
1
3
0
2
1
0
0
1
4
6
0
0
0
0
0
]
=
[
R
d
]
\begin{bmatrix} 1 & 3 & 0 & 2 & 1\\ 0 & 0 & 1 & 4 & 6\\ 0 & 0& 0 & 0 & 0\\ \end{bmatrix}=\begin{bmatrix} R&d \end{bmatrix}
⎣⎡100300010240160⎦⎤=[Rd]
最后一行
R
R
R是全零行,对应的同行的
d
d
d也为0。继续考虑一般情况:
[
1
3
0
2
b
1
0
0
1
4
b
2
1
3
1
6
b
3
]
=
[
1
3
0
2
b
1
0
0
1
4
b
2
0
0
0
0
b
3
−
b
2
−
b
1
]
\begin{bmatrix} 1 &3&0&2&b_1\\ 0&0&1&4&b_2\\ 1&3&1&6&b_3 \end{bmatrix}= \begin{bmatrix} 1 &3&0&2&b_1\\ 0&0&1&4&b_2\\ 0&0&0&0&b_3-b_2-b_1 \end{bmatrix}
⎣⎡101303011246b1b2b3⎦⎤=⎣⎡100300010240b1b2b3−b2−b1⎦⎤
行向量组合如果是零向量,那么对应的结果向量也必须有相同的变换。
b
3
−
b
2
−
b
1
=
0
b_3-b_2-b_1=0
b3−b2−b1=0时,最后一个等式才成立;从列空间来看,所有向量都无法对
b
b
b的最后一行造成任何影响,所以它必须是0。
二、一个特解
还是以上一段提到的矩阵为例:
[
1
3
0
2
1
0
0
1
4
6
0
0
0
0
0
]
\begin{bmatrix} 1 & 3 & 0 & 2 & 1\\ 0 & 0 & 1 & 4 & 6\\ 0 & 0& 0 & 0 & 0\\ \end{bmatrix}
⎣⎡100300010240160⎦⎤
在确保最后一个方程成立后,方程必然有解,因为单位向量能够组成除了零行的任何向量。自由向量依然可以随意选取,最简单的不就是全零,因此我们得到唯一的特解:
x
p
=
[
1
0
6
0
]
x_p=\begin{bmatrix}1\\0\\6\\0\end{bmatrix}
xp=⎣⎢⎢⎡1060⎦⎥⎥⎤,从这个意义上看,特解像是不考虑自由列的,完全由主列决定的唯一解。
主元列是唯一有效输入至结果变量的,其比例是稳定的,再叠加上零空间的解(不会使得已经输出的结果改变)。于是最终方程的解为:
x
=
x
p
+
x
n
=
[
1
0
6
0
]
+
x
2
[
−
3
1
6
0
]
+
x
4
[
−
2
0
−
4
1
]
x=x_p+x_n=\begin{bmatrix}1\\0\\6\\0\end{bmatrix}+x_2\begin{bmatrix}-3\\1\\6\\0\end{bmatrix}+x_4\begin{bmatrix}-2\\0\\-4\\1\end{bmatrix}
x=xp+xn=⎣⎢⎢⎡1060⎦⎥⎥⎤+x2⎣⎢⎢⎡−3160⎦⎥⎥⎤+x4⎣⎢⎢⎡−20−41⎦⎥⎥⎤
个人觉得可以这么理解,一个三维空间,主列向量其实就类似于基底,因为所有其他自由向量都可以由他们表示,其他都是基底的线性组合。从图像的角度来看,在四维空间中,他表示一个过 x p x_p xp的三维空间。
三、矩阵秩与解的关系
对于一个秩为 r r r的 m × n m\times n m×n系数矩阵A:( r < m r<m r<m 且 r < n r<n r<n)
列满秩 r = n r=n r=n,每一列都有主元,也就是没有自由向量,又高又瘦;
行满秩 r = m r=m r=m,每一行都有主元, n − r n-r n−r或者 m − r m-r m−r自由向量,又胖又矮;
r = m = n r=m=n r=m=n,方阵,一定是可逆的