多元线性回归（吴恩达机器学习笔记）-CFANZ编程社区

对房价模型增加更多的特征，如房间数，楼层数等，构成了一个含有多变量的模型，模型中特征为 $x_{1},x_{2}...x_{n})$ .
在这里插入图片描述

其中n代表特征数量，m代表训练集中的实列数量。

$x^{(i)}$ 代表第i个训练实列。

$x^{(i)}_{j}$ 代表特征矩阵中第i行的第j个特征。

多变量的回归的假设h为： $h_{\theta}(x)=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+...+\theta_{n}x_{n}$ .由于有n+1个参数变量，n个变量，为了简化计算，引入了 $x_{0}=1$ .则：

$X=\left[\begin{matrix}x_{0}\\x_{1}\\x_{2}\\...\\x_{n}\end{matrix}\right]$ $\theta=\left[\begin{matrix}\theta_{0}\\\theta_{1}\\\theta_{2}\\...\\\theta_{n}\end{matrix}\right]$

则 $h_{\theta}(x)=\theta_{0}x_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+...\theta_{n}x_{n}$ = $\theta^{T}X$

求解 $\theta$

1.梯度下降法

构造代价函数 $J(\theta_{0},\theta_{1},...\theta_{n})=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^{2}$

运用梯度下降法：

$\theta_{j}=\theta_{j}-\alpha \frac{\partial}{\partial\theta_{j}}J(\theta_{0},\theta_{1},...,\theta_{n})$

$\theta_{j}=\theta_{j}-\alpha \frac{\partial}{\partial\theta_{j}}\frac{1}{2m}\sum_{i=1}^{m}({h_{\theta}(x^{(i)})-y^{(i)}})^{2}$

$\theta_{j}=\theta_{j}-\alpha \frac{1}{m}\sum_{i=1}^{m}({h_{\theta}(x^{(i)})-y^{(i)}})x^{(i)}_{j}$

2.正规方程

正规方程通过是通过对代价函数进行求导，并使其导数为0，来解得 $\theta$ .假设训练集的特征矩阵为X，训练结果为向量y，则利用正规方程求解出 $\theta=(X^{T}X)^{-1}X^{T}y$

当特征变量数目小于1万以下时，通常使用正规方程来求解，大于一万则使用梯度下降法。

梯度下降法实践

1.特征缩放

以房价为例，假设我们使用两个特征（房屋的尺寸大小和房间的数量），并且令 $\theta_{0}=0$ ,尺寸大小为 $0 — 2000$ 平方尺，而房间数量则是 $0 - 5$ 间，则以两个参数分别为横纵坐标轴，绘制出代价函数的等高线图。其图像将会是一个很扁的椭圆形，此时进行梯度下降法时，往往需要很多次迭代才能够收敛。
在这里插入图片描述