支持向量机

我们对支持向量机的理解，可以用二维来说明，比如需要找一条最优的直线(超平面)将两类点分开：
在这里插入图片描述
不过这里需要定义一下说明是最优，那就是：

如下有5个蓝色样本，标记为y =1，紫色有5个样本，标记为 y=-1，共10个样本： ${(x₁ ,y₁) , (x₂,y₂) .........(x_{10},y_{10}) \}$ 。
在这里插入图片描述
平面（分割线）为 $w^T\cdot x+b\cdot 1=0$

样本点到超平面的距离即为 $x_i$ 在向量 $w$ 的投影再加上b，即 $w^T\cdot x+b\cdot 1$ ，不过我们知道这个投影值可能是负的，我们再加一个符号纠正项即可： $y_i\times y(x_i)$

点到平面距离定义

所以我们可以定义出任意样本点的距离，为超平面(w, b)关于训练数据集的函数间隔 $y_i\cdot y(x_i)$

但是这样简单定义的距离存在的问题是：

考虑到 $x=x_0 + w^T \cdot r$ ，其中 $x_0$ 为分割直线上的点，恰好使得法向量 $w$ 方向的投影值为-b：

我们只需要将法向量归一化即可，即有:
$x=x_0 + \frac{w}{||w||} \cdot r$
其中 $r$ 即为投影距离。

所以我们可以算出距离函数 $r_i$ :
$r_i=\frac{y(x_i)}{||w||}$
加上之前的符号修正，即有： $r_i=\frac{y_i\cdot y(x_i)}{||w||}$

凸优化训练

我们的目的就是找到使得最近的点 $i$ 到直线具有最大间距:
$\gamma =max_{[w，b]}\{r_i\}$

所以对于任意点 $i$ ，我们会有 $r_i ≥ \gamma$ ，即
$\frac{y_i\cdot y(x_i)}{||w||}≥ \gamma$
两边同除 $\gamma$ 得：
在这里插入图片描述
由于我们之前就注意到，对于[w,b]，他们同时扩大相同的倍数，并不会改变分类结果，所以对于缩小 $∣ ∣ w ∣ ∣$ 还是 $||w||\cdot \gamma$ 倍，其实也不会改变分类结果