Bert模型学习笔记-CFANZ编程社区

Bert模型学习笔记

From https://www.bilibili.com/video/BV1Ey4y1874y emmm 讲实话这个视频太简单了，不建议看。

可以看看李沐的视频：https://www.bilibili.com/video/BV1PL411M7eQ

这篇文章主要是四个部分：

Bert架构

Bert模型学习笔记_bert

在Transformer中使用了位置编码作为输入，但是在bert中使用的是：

Bert模型学习笔记_学习_03

两种目标函数：

AR：其实就是类似GPT中的预训练任务，预测下一个单词。

AE：将某个位置的词语mask掉，然后进行预训练。

0 条评论