UCSD研究团队提出PettingLLMs框架,实现了大语言模型的多智能体“群体强化”学习,工具调用能力提升5.8倍。该框架结合树状采样与角色化奖励机制,支持多智能体协作训练,显著提高任务表现,适用于医疗和编程等领域。实验结果显示,规划类任务性能从14%提升至96%。
完成下面两步后,将自动完成登录并继续当前操作。