本研究解决了大语言模型(LLMs)在信息检索中的搜索能力不足问题。提出了ZeroSearch,一个通过强化学习框架来激励LLMs搜索能力的新方法,该方法不依赖真实搜索引擎,使用轻量级的监督微调并逐步提高检索难度。研究表明,ZeroSearch能有效提升LLMs的检索能力,且在参数规模较大的模型上性能优越。
完成下面两步后,将自动完成登录并继续当前操作。