0
点赞
收藏
分享

微信扫一扫

机器学习新手如何应对数据集不平衡的情况?

1、增加少数类别的样本数量,可以通过复制样本或使用SMOTE(Synthetic Minority Over-sampling Technique)等技术生成新的样本

2、减少多数类别的样本数量,可以通过随机删除样本或使用CV(Cross-Validation)等技术

3、使用专门处理不平衡数据的算法

4、使用集成学习方法,如Bagging、Boosting等

举报

相关推荐

0 条评论