0
点赞
收藏
分享

微信扫一扫

机器学习(李宏毅)—— Regression

Regression:输入可以是股票市场的各种指数、自动驾驶的检测角度、大数据推荐系统,输出是数字。

Underfitting(欠拟合):模型不能很好的拟合训练集的数据,即模型有很大的bias(偏差)。
Overfitting(过拟合):模型可以很好的拟合训练集的数据,但是在测试集上有很大的误差,即模型有很大的variance(方差)。当模型越来越复杂时,bias越来越小而variance会变大。
对于欠拟合,可以重新设计模型:在输入上增加更多的特征;更复杂的模型。对于过拟合,可以从数据集和模型两个方面进行处理:更多的数据集(非常有效,但不是一直奏效);regularization(正则化,使模型的预测曲线趋于平滑,但有可能增大bias)

将原始训练集划分为Training(新训练集)和Validation(验证集):训练集是为了训练模型,验证集是为了筛选最好的模型。还可以将原始训练集划分为两份新训练集和一份验证集(循环划分)。

举报

相关推荐

0 条评论