BriefGPT - AI 论文速递 ·

可验证的生成带有子句级细粒度引用

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文探讨了基于大型语言模型的引文生成方法，提出通过整合目标论文与源论文生成连贯段落。研究表明，结合知识图谱可提升生成性能，并介绍了细粒度奖励训练框架，验证了模型的有效性。实验结果显示，该方法在多个基准测试中表现优异，推动了科学文档之间的复杂连接探索。

🎯

❓

通过将目标论文的知识图谱整合到生成引文文本的提示中，可以显著提升引文生成的性能。

细粒度奖励训练框架用于教授大型语言模型生成高度相关和支持的引用文献，确保回答的正确性。

ALCE基准测试用于自动化评估大型语言模型的引用质量，衡量流畅度、正确性和引用质量三个维度。

LLatrieval模型通过更新检索结果来验证文档支持性，使语言模型能够迭代反馈以确保生成的可验证性。

通过“先选后生成”方法，将生成过程分为内容选择、句子规划和顺序句子生成三个步骤，确保输出的细粒度归属。

PMOA-CITE数据集是一个新构建的数据集，证明了模型在引用检测上的先进性能，并揭示了促进和抑制引用的特定语言运用。

🏷️