BartForConditionalGeneration的使用细节-CFANZ编程社区

BartForConditionalGeneration的使用细节

1. BartForConditionalGeneration 类的各个参数

先聊聊输入到 BartForConditionalGeneration 类的各个参数是什么意思？这个部分是比较重要的。

是必须要以 <s> 开头的。这个参数可以自己生成然后传入到模型中，也可以交由代码自己生成（一般会根据label右移一位再补0）

case 1：直接传入

此时的 decoder_input_ids 如下：
case 2：由labels 右移一位生成

decoder_start_token_id 的值为2（一般需要指定），对应的token是</s>。最后返回 shifted_input_ids 作为 decoder_input_ids
需要注意 labels 的起始是没有 <s> token的。

细心的读者会发现这两种方法得到的 decoder_input_ids 是不同的（就是因为这个 decoder_start_token_id 值的不同）。