我们开发了一款AI软件工程师,解决了SWE基准测试中48.60%的问题,完全开源。

我们开发了一款AI软件工程师,解决了SWE基准测试中48.60%的问题,完全开源。

💡 原文英文,约300词,阅读约需2分钟。
📝

内容提要

Composio推出SWE-Kit工具包,帮助用户构建自定义AI编码代理,支持本地自动化编码工作流程,并通过SWE-bench进行效率测试。该开源工具可与GitHub、Jira等集成,自动化软件开发的多个方面。

🎯

关键要点

  • Composio推出SWE-Kit工具包,帮助用户构建自定义AI编码代理。
  • SWE-Kit是一个启动模板,包含构建AI编码代理所需的所有工具包。
  • 这些代理可以在本地端到端运行,以自动化编码工作流程。
  • 使用LangGraph构建的开源AI代理在SWE-bench上进行了效率测试,得分为48.60%和41%。
  • SWE-bench是一个基准测试,包含2200多个来自Django、Flask等库的真实Python问题。
  • SWE-Kit提供了多种工具,包括代码分析工具、文件工具、Shell工具和Git工具。
  • 用户可以将SWE-Kit与GitHub、Jira、Linear、Slack等集成,构建完整的AI软件工程师。
  • 可以自动化软件开发工作流程的多个方面,包括编写代码、重构代码、测试、文档和项目管理。
  • SWE-Kit代理的架构解释可以在LangChains的博客上找到。
  • 鼓励用户立即开始使用SWE-Kit构建自定义本地编码代理。
➡️

继续阅读