小红花·文摘

本研究提出了一种基于强化学习的框架OTC-PO，旨在提高工具集成推理效率。通过引入工具集成奖励，显著减少工具调用次数，提升生产力。实验结果表明，该框架在问答基准测试中表现优异。

BriefGPT - AI 论文速递 ·

本研究提出了ConceptEdit框架，旨在解决大型语言模型中的常识知识编辑问题。通过整合概念化与实例化，提升模型的常识推理能力。实验结果表明，采用ConceptEdit的模型在常识知识生成和问答测试中优于其他基线模型。

BriefGPT - AI 论文速递 ·