0

点赞

收藏

分享

RecAdam optimizer 阅读笔记

莞尔小迷糊 2022-07-27 阅读 13

标签: 数据编程语言

Recall and Learn: Fine-tuning Deep Pretrained Language Models with Less Forgetting

摘要

在优化器角度，全任务提升BERT fine-tune的效果

做法

提出模拟预训练，可以fine-tune时无数据预训练
提出目标Shifting，可以在模拟预训练同时训练fine-tune目标

大概思想

loss使之和 fine-tune之前的模型参数有关

RecAdam optimizer 阅读笔记_数据

其中θ是fine-tune时模型，θ*是fine-tune之前的模型

实验结果

RecAdam optimizer 阅读笔记_数据_02

0 条评论

莞尔小迷糊

关注