小红花·文摘

机器之心 ·

本文提出了一种细粒度奖励的训练框架，以提高大型语言模型在引用生成和回答正确性方面的表现。通过多个基准测试验证，细粒度奖励显著提升了模型性能，超越了GPT-3.5-turbo。此外，研究还介绍了ALCE评测基准和自我认可框架，以减少生成内容中的事实错误，提高模型的可信度和可验证性。

BriefGPT - AI 论文速递 ·

本文探讨了基于大型语言模型的引文生成方法，提出通过整合目标论文与源论文生成连贯段落。研究表明，结合知识图谱可提升生成性能，并介绍了细粒度奖励训练框架，验证了模型的有效性。实验结果显示，该方法在多个基准测试中表现优异，推动了科学文档之间的复杂连接探索。

BriefGPT - AI 论文速递 ·