为什么position embedding就是相加一个随机矩阵-CFANZ编程社区

为什么position embedding就是相加一个随机矩阵

程序小小黑

阅读 126

2022-07-27

position embedding BERT 里的实现：

为什么position embedding就是相加一个随机矩阵_其它

要思考一个问题，什么是position embedding，

就是：

如果每个position的位置用0,1,2,3,4…来表示的话，

怎样像word embedding似的输进模型里呢，

就是两种办法：

one-hot

或者

把position的0,1,2,3,4看成word id一样用embedding_lookup表示成和word embedding同样维数，也就是用一个vector代表0，用一个vector代表1，用一个vector代表2……

position 0,1,2,3,4每个id或index都会转成一个vector，合起来也就是一个随机矩阵！所以看position embedding的另一种实现：

为什么position embedding就是相加一个随机矩阵_其它_02

为什么position embedding就是相加一个随机矩阵_其它_03

相关推荐
妖妖妈
 为什么应避免将一个很大的实数与一个很小的实数直接相加或相减？
妖妖妈 63 0 0
往复随安_5bb5
 data为什么是一个函数
往复随安_5bb5 129 0 0
嚯霍嚯
 为什么去开发一个MLSQL
嚯霍嚯 109 0 0
践行数据分析
 为什么通信就是不如IT？
践行数据分析 144 0 0
才德的女子
 vue的data为什么是一个函数
才德的女子 154 0 0
鲤鱼打个滚
 为什么promise就是微队列？setTimeOut就是宏队列？
鲤鱼打个滚 227 0 0
捡历史的小木板
 matlab：如何使一个矩阵中的每个元素分别和另一个矩阵相乘，形成一个个分块矩阵，最终拼装成一个矩阵
捡历史的小木板 84 0 0
陆佃
 一个非常简单的函数为什么会崩溃
陆佃 63 0 0
玉新行者
 vue组件中data为什么是一个function？
玉新行者 168 0 0
一只1994
 为什么我要自己做一个周易软件
一只1994 69 0 0

精彩评论（0）