💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

Mistral AI发布了开源大型语言模型Devstral,旨在提升软件工程自动化,尤其在复杂编码环境中表现出色。Devstral能够处理实际编程问题,支持跨文件修改和代码探索,在SWE-Bench Verified基准测试中得分46.8%,超越其他开源模型。该模型可在普通GPU上运行,支持长达128,000个token的上下文,适合开发者使用。

🎯

关键要点

  • Mistral AI发布了开源大型语言模型Devstral,旨在提升软件工程自动化,特别是在复杂编码环境中。
  • Devstral能够处理实际编程问题,支持跨文件修改和代码探索,适合现代软件工程需求。
  • 在SWE-Bench Verified基准测试中,Devstral得分46.8%,超越其他开源模型。
  • Devstral从Mistral Small 3.1基础模型微调而来,支持长达128,000个token的上下文。
  • 该模型可在普通GPU上运行,降低了开发者和研究人员的使用门槛。
  • Mistral以Apache 2.0许可证发布Devstral,允许商业和非商业使用及修改。
  • 社区反馈对Devstral表现出兴奋和批评,用户对其性能给予好评。
  • Devstral的发布标志着大型语言模型在实际软件工程应用中的进步,Mistral正在开发更大版本的模型。
➡️

继续阅读