诸神缄默不语-个人CSDN博文目录
VX号“PolarisRisingWar”可直接搜索添加作者好友讨论。
本文是作者在学习文本摘要任务的过程中,根据学习资料总结逐步得到并整理为成文的相关内容。相关学习资料(包括论文、博文、视频等)都会以脚注等形式标明。有一些在一篇内会导致篇幅过长的内容会延伸到其他博文中撰写,但会在本文中提供超链接。
本文会长期更新,更新日志附在本文末尾。
文章目录
1. 任务分类:生成式摘要和抽取式摘要
生成式摘要abstractive summarization
抽取式摘要extractive summarization
2. 抽取式摘要
2.2 无监督方法
2.3 有监督方法
3. 生成式摘要
3.1 抽取+生成(重写)
[Bing et al., 2015]1:分成两个阶段:第一步,通过无监督的方法或语言学知识来抽取原文中的关键文本元素(key textual elements)。第二步,用语言学规则或文本生成方法来rewrite或paraphrase抽取出来的元素,生成原文的准确摘要。(转引自[Hu et al., 2015]2)
3.2 纯生成式方法
Lidong Bing, Piji Li, Yi Liao, Wai Lam, Weiwei Guo, and Rebecca Passonneau. 2015. Abstractive multi-document summarization via phrase selection and merging. In Proceedings of the ACL-IJCNLP, pages 1587–1597, Beijing, China, July. Association for Computational Linguistics. ↩︎
Hu B, Chen Q, Zhu F. LCSTS: A Large Scale Chinese Short Text Summarization Dataset)[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. 2015: 1967-1972. ↩︎