The JetBrains Blog ·

使用TeamCity和SWE-bench测试AI编码代理

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

JetBrains开发了AI编码代理Junie的测试系统，利用TeamCity和SWE-bench基准进行真实任务评估。通过缓存数据集和Docker镜像，确保测试环境稳定，降低失败率，提高效率。该系统提供可靠的性能指标，帮助开发者评估AI代理的质量。

🎯

🏷️

AI编码代理可以编写代码，Crafting希望帮助他们交付
Crafting CEO Sumeet Vaidya表示，六到九个月前，大家关注AI代理的快速代码生成，但他和联合创始人意识到，工程组织在扩展时面临协调和资源使用等挑战。
直播：JetBrains IDE 插件中的 UI 冻结及其避免方法
JetBrains可使用我的姓名、邮箱和位置信息发送通讯，并处理个人数据。我可以随时撤回同意，邮件中有退订链接。
2026年你应该尝试的6个最佳AI代理记忆框架
Bala Priya C是一位来自印度的开发者和技术作家，专注于数学、编程、数据科学和内容创作。她的兴趣包括DevOps、数据科学和自然语言处理，热爱阅读...
Robo.ai首席执行官：响应阿联酋国家战略，持续加码本地科技与创新投资
Robo.ai首席执行官Benjamin Zhai在专访中分析了公司在阿联酋科技产业的布局，强调该地区的抗周期性和投资潜力。公司通过AI软件和智能硬件实现...
Qt Group与高通合作，简化工业AI设备开发流程
Qt Group与高通合作，优化Qt框架以支持高通物联网处理器，简化边缘AI设备的开发。开发者可通过Qt Edge AI API轻松实现复杂应用，无需深入...
OpenAI宣布收购AI安全初创公司Promptfoo 可以提高智能体的安全防御能力
OpenAI 收购了 AI 安全初创公司 Promptfoo，旨在提升 AI 智能体的安全性。Promptfoo 成立于 2024 年，估值 8600 万...