提出了一种新的基于爬山算法和词级抽取的无监督句子摘要方法
作者:Raphael Schumann, Lili Mou, Yao Lu, Olga Vechtomova and Katja Markert
摘要
自动句子摘要生成句子的较短版本,同时保留其最重要的信息。一个好的摘要的特点是语言流畅,与原句的信息重叠度高。我们在一个无监督的目标函数中对这两个方面进行建模,包括语言建模和语义相似性度量。我们通过离散优化来寻找高分的摘要。
本文提出的方法实现了基于Rouge评分的无监督句子摘要的新发展。此外,我们还证明了通常报道的Rouge F1度量对摘要长度很敏感。由于这在最近的工作中被不情愿地利用了,我们强调,未来的评估应该明确地按照输出长度括号对摘要系统进行分组。
简介
本文的主要贡献在于:
- 提出了一种新的基于爬山算法和词级抽取的无监督句子摘要方法
- 我们的性能优于现有的无监督句子摘要系统,包括更复杂的句子重构模型
- 我们发现Rouge F1对摘要长度很敏感,因此强调了明确控制摘要长度的重要性,以便在不同的摘要系统之间进行公平比较
名词解释
hill climbing:爬山算法