小红花·文摘

本研究解决了大语言模型（LLMs）在信息检索中的搜索能力不足问题。提出了ZeroSearch，一个通过强化学习框架来激励LLMs搜索能力的新方法，该方法不依赖真实搜索引擎，使用轻量级的监督微调并逐步提高检索难度。研究表明，ZeroSearch能有效提升LLMs的检索能力，且在参数规模较大的模型上性能优越。