0
点赞
收藏
分享

微信扫一扫

【论文泛读】Multimodal Neural Graph Memory Networks for Visual Question Answering


生成词向量的一种方法
​​理解GloVe模型(Global vectors for word representation)​​ GRU是LSTM的一种变形,LSTM和CRU都是通过各种门函数来将重要特征保留下来,这样就保证了在long-term传播的时候也不会丢失。此外GRU相对于LSTM少了一个门函数,因此在参数的数量上也是要少于LSTM的,所以整体上GRU的训练速度要快于LSTM的。
两个网络的好坏还是得看具体的应用场景。
​​门控循环单元(GRU)的基本概念与原理​​


举报

相关推荐

0 条评论