腾讯优图实验室与中山大学、清华大学合作的研究评估了大型语言模型(LLM)智能体在工具失败场景下的动态重规划能力。研究表明,隐式语义失败的恢复难度远高于显式故障,复杂的拓扑结构可能导致智能体陷入无效循环。此外,动态重规划能力的提升滞后于基本性能,强调了状态管理与异常检测结合的重要性。
完成下面两步后,将自动完成登录并继续当前操作。