本文提出ReSearch框架,旨在解决大型语言模型在推理中整合外部检索的挑战,尤其是复杂的多跳问题。通过强化学习训练,实验证明该方法在多个基准测试中展现出强大的泛化能力,提升了模型的反思与自我修正能力。
完成下面两步后,将自动完成登录并继续当前操作。