本研究提出ReflAct方法,解决了现有LLM代理在复杂环境中推理不一致的问题。通过持续反思状态与目标的关系,显著提高了决策的合理性,成功率达到93.3%。
完成下面两步后,将自动完成登录并继续当前操作。