0
点赞
收藏
分享

微信扫一扫

BERT模型在训练时会出现预测结果只有一个标签

原因:

学习率设置的较大,导致梯度爆炸

解决办法:

更改为较小的学习率

举报

相关推荐

0 条评论