微信扫一扫
最近在做一个翻译模型的时候遇到了标签长度不均衡的问题,导致预测的结果尾部效果差。
改进编码方式使得长度均衡。
突然想起翻译模型的时候也有这个问题 要让训练样本对齐长度才能较好收敛模型。
相关推荐