0
点赞
收藏
分享

微信扫一扫

深度学习-循环神经网络

眸晓 2022-01-31 阅读 72

                

梯度裁剪能有效预防梯度爆炸

循环神经网络的输出取决于当下输入和前一时间的隐变量

通常使用困惑度来衡量语言模型的好坏 

 

举报

相关推荐

0 条评论