本研究提出了一种基于强化学习的框架OTC-PO,旨在提高工具集成推理效率。通过引入工具集成奖励,显著减少工具调用次数,提升生产力。实验结果表明,该框架在问答基准测试中表现优异。
本研究提出了ConceptEdit框架,旨在解决大型语言模型中的常识知识编辑问题。通过整合概念化与实例化,提升模型的常识推理能力。实验结果表明,采用ConceptEdit的模型在常识知识生成和问答测试中优于其他基线模型。
完成下面两步后,将自动完成登录并继续当前操作。