python机器学习模型选择与调优—交叉验证、超参数搜索-网格搜索-CFANZ编程社区

python机器学习模型选择与调优—交叉验证、超参数搜索-网格搜索

机器学习模型选择与调优

常见方法：

交叉验证：将拿到的训练数据，分为训练和验证集。交叉验证目的：为了让被评估的模型更加准确可信。以下图为例：将数据分成4份，其中一份作为验证集。然后经过4次（组）的测试，每次都更换不同的验证集。即得到4组模型的结果，取平均值作为最终结果。又称4折交叉验证。实际业务中常使用10折交叉验证。

python机器学习模型选择与调优—交叉验证、超参数搜索-网格搜索_交叉验证

我们在做数据集划分是时候将数据分为训练集和测试集，但是为了让从训练得到模型结果更加准确。做以下处理：

通常情况下，有很多参数是需要手动指定的（如k-近邻算法中的K值），这种叫超参数。但是手动过程繁杂，所以需要对模型预设几种超参数组合，每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型。如：如k-近邻算法中，

网格搜索和交叉验证。对估计器的指定参数值进行详尽搜索。

estimator：估计器对象
param_grid：{"n_neighbors":[1,3,5,...]}，估计器参数(dic)，如knn表示k可能的取值，最终会每个值进行测算，得出最优结果。
cv：指定n折交叉验证(常用10)

python机器学习模型选择与调优—交叉验证、超参数搜索-网格搜索_搜索_02

0 条评论