0
点赞
收藏
分享

微信扫一扫

2022-2-15第四章机器学习进阶--XGboost

XGboost

在这里插入图片描述

例1 agaricus_test

在这里插入图片描述
(稀疏数据集的特殊存储方式),01矩阵通过只表示1的位置
①读取数据
在这里插入图片描述②参数设置(二分类)

在这里插入图片描述Param-树的深度、eta—防止模型学习太快-衰减因子<1、silent—
Watchlist监控模型学习何时停止,
evals-训练期间将评估指标的验证集列表,验证列表会帮助我们跟踪模型性能
N_round—决策树数量
Data_train-包含x和y,obj定义一个目标函数写入公式,

③计算错误率
在这里插入图片描述

例2:鸢尾花

①数据读取
在这里插入图片描述②参数设定(三分类softmax)
在这里插入图片描述

例3 wine

①数据读取分割
在这里插入图片描述

②logistic
在这里插入图片描述③xgboost分类–分类标记必须从0开始,需要调整分类名称
在这里插入图片描述

taitanic

数据处理部分
①对性别进行映射
在这里插入图片描述
②缺失值处理

在这里插入图片描述③使用随机森林预测年龄
在这里插入图片描述
④对其实城市编码
在这里插入图片描述⑤数据划分

在这里插入图片描述
训练就是直接调用
注:大数据维度高-精度优先用CNN或者SVM(调参)

举报

相关推荐

第四章

第四章总结

第四章:表

第四章、数组

第四章:Hbase

0 条评论