💡
原文英文,约600词,阅读约需2分钟。
📝
内容提要
艾伦人工智能研究所(Ai2)推出了一系列开源编码代理模型,性能优于同类产品。用户可以根据私有代码库进行微调,以提升特定任务的表现。新模型SERA-32B和SERA-8B在解决GitHub问题上表现出色,且训练成本显著低于传统方法。通过创新的软验证生成和多样化训练数据,Ai2旨在让强大的编码代理更易获取。
🎯
关键要点
- 艾伦人工智能研究所(Ai2)推出了一系列开源编码代理模型,性能优于同类产品。
- 用户可以根据私有代码库进行微调,以提升特定任务的表现。
- 新模型SERA-32B和SERA-8B在解决GitHub问题上表现出色,训练成本显著低于传统方法。
- 复制Ai2的结果成本为400美元,最佳性能成本超过2000美元,传统方法可高达11倍。
- SERA模型的训练使用了两台Nvidia H100集群。
- SERA-32B模型在解决实际GitHub问题上表现优于其他同类模型。
- 小型模型在微调后有时会超越其大型“教师”模型的表现。
- Ai2通过软验证生成(SVG)和多样化训练数据集降低了训练成本。
- 软验证生成方法允许使用部分正确的解决方案进行训练,减少了计算密集型测试的需求。
- Ai2创建了51种错误模式的分类法,以多样化训练数据集,生成低成本的多样化代理轨迹。
- 降低强编码代理的复制成本将使研究变得更加广泛可及,惠及小团队、学生和独立开发者。
➡️