0
点赞
收藏
分享

微信扫一扫

最小二乘的概率解释


在线性回归中,我们以最小二乘来作为损失函数,然后使得这个损失函数的值最小。那么为什么会选择最小二乘

而不是其它的指标呢? 今天就用概率方面的知识来解释。首先,设

 

     

最小二乘的概率解释_最大似然估计

 

其中

最小二乘的概率解释_最小二乘_02

是样本的误差纠正量。由于我们目的是训练出合适的参数

最小二乘的概率解释_最小二乘_03

,使得

最小二乘的概率解释_最大似然估计_04

的绝对值尽量小,那么可以确定大部分

最小二乘的概率解释_最小二乘_05

的值集中在0附近,而少数值离0较远,很明显,这可以看成随机变量

最小二乘的概率解释_最大似然估计_06

服从高斯分布。即

 

     

最小二乘的概率解释_最小二乘_07

 

那么概率密度函数为

 

     

最小二乘的概率解释_最小二乘_08

 

那么也就是说有

 

     

最小二乘的概率解释_最大似然估计_09

 

亦即

 

      

最小二乘的概率解释_最小二乘_10

 

那么进一步得到联合概率密度函数为

 

      

最小二乘的概率解释_概率密度函数_11

 

现在我们来求最大似然估计,即找到合适的参数

最小二乘的概率解释_概率密度函数_12

,使得上述概率取值最大。两边分别取对数得到

 

      

最小二乘的概率解释_最大似然估计_13

 

要是上述目标函数值最大,那么只需要

 

      

最小二乘的概率解释_概率密度函数_14

 

最小即可。这就解释了线性回归为什么要选用最小二乘作为衡量指标了。多么美的自然科学啊!!!

 

现在想想Logistic回归也是基于一个假设,即概率只能为0或者1,它是用一个Sigmoid函数来把数据范围映射

到区间[0,1]上的,最后根据联合概率密度函数求最大似然估计。

 

 

举报

相关推荐

0 条评论