SEM: A Reinforcement Learning Framework for Efficient Search in Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨大型语言模型在何种情况下调用搜索引擎与依赖内部知识,提出了一种新型后训练强化学习框架SEM,以减少冗余搜索,提高推理效率和回答准确率。
🎯
关键要点
- 本研究探讨大型语言模型在何时调用搜索引擎与何时依赖内部知识的问题。
- 现有强化学习方法常导致搜索行为冗余,效率低下。
- 提出了一种新型后训练强化学习框架SEM。
- SEM通过构建平衡的数据集和结构化推理模板,显著减少冗余搜索操作。
- 在多个基准测试中,SEM保持或提高了回答准确率。
- SEM提升了模型的推理效率与外部知识的使用能力。
➡️