【论文泛读】Multimodal Neural Graph Memory Networks for Visual Question Answering

小_北_爸 2023-03-08 阅读 68

标签: python 算法人工智能深度学习应用场景 JavaScript 前端开发

生成词向量的一种方法
理解GloVe模型（Global vectors for word representation） GRU是LSTM的一种变形，LSTM和CRU都是通过各种门函数来将重要特征保留下来，这样就保证了在long-term传播的时候也不会丢失。此外GRU相对于LSTM少了一个门函数，因此在参数的数量上也是要少于LSTM的，所以整体上GRU的训练速度要快于LSTM的。
两个网络的好坏还是得看具体的应用场景。
门控循环单元（GRU）的基本概念与原理

0 条评论

小_北_爸

关注