少样本关系抽取任务的目标
是通过利用极少量的标注数据训练(或Fine-Tuning)模型,使得模型可以快速学习到一个关系类别的特征,从而对这样只有极少数样本的类别进行准确分类。图2所示是少样本关系抽取任务的一个范式,初始网络参数f_θ使用少量关系Ri的实例进行训练或微调后得到参数f_(θi ),这组参数可以很好地用于提取对应的关系Ri。少样本学习中常见的实验设置一般被称为N-way-K-shot,N-way代表分类任务中可能的类别数量,K-shot表示每个类别有K个训练数据。https://zhuanlan.zhihu.com/p/159438322
bench mark
fewrel
对少样本关系抽取的一些思考
虽然少样本关系抽取已经取得了一些成果,但仍有一些问题值得我们去思考。例如在少样本典型的N-way K-shot场景在真实的关系抽取场景中可能并不完全适用。实际应用场景中,每个关系类别的标注实例很可能是极度不均匀的,有着严重的长尾分布问题。如何更好地利用多出来的标注数据提升只有极少数实例类别的性能,是一个值得我们思考的问题。少量样本或许不足以覆盖一个关系的完整语义,那如何利用好已有的知识和语料来更好地应对关系抽取的冷启动问题也值得思考。另外,最近有一些工作开始考虑从图像中抽取实体关系(如文献[11]),这是多模态知识图谱构建的核心技术之一。
此外,在实际的知识图谱构建应用场景中,图谱的构建都是一个持续地不断迭代更新的过程,这就要求关系抽取模型也能应对持续增量的场景。如何克服增量关系抽取过程中的灾难性遗忘问题,也需要我们继续去探索