基于 LLM 伪标签的半监督学习提升抽取式摘要生成
原文中文,约300字,阅读约需1分钟。发表于: 。使用半监督方法解决在有限标记数据场景下的提取式文本摘要任务,提出了一种基于 GPT-4 的基于提示的伪标签选择策略,通过使用 LLM 评估和生成伪标签,改进了不同数据集上的 ROUGE-1 指标 10-20%,减少了无标记样本数量。
研究使用不同语言模型评估生成的摘要,发现text-davinci-003模型最佳。分析CNN Daily Mail和XSum数据集,为NLP研究人员提供有价值的见解。