Refact.ai Agent在SWE-bench Lite中成功解决了300个任务中的179个,成功率为59.7%。该代理完全自主,无需人工干预,具备规划、执行、测试和自我修正能力。使用的Claude 3.7模型展现了出色的多步骤指令处理能力,深度分析工具提升了解决方案质量,表明AI代理在软件工程任务中的自主处理能力日益增强。
完成下面两步后,将自动完成登录并继续当前操作。