权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了

权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了

💡 原文日文,约1300字,阅读约需3分钟。
📝

内容提要

OpenAI上线GPT-4o-mini,苹果发布DCLM-7B开源模型,性能超越Mistral-7B,接近其他领先模型。DCLM是开源的最佳模型,提供模型权重、训练代码和预训练数据集。DCLM是语言模型新基准,通过高质量数据集提高模型性能。DCLM-7B在多任务上表现优秀,计算量仅为Llama 3 8B的1/6。

🎯

关键要点

  • OpenAI上线小模型GPT-4o-mini,苹果发布DCLM-7B开源模型。
  • DCLM-7B性能超越Mistral-7B,接近其他领先模型如Llama 3和Gemma。
  • DCLM被称为真正开源的最佳模型,开源模型权重、训练代码和预训练数据集。
  • DCLM是语言模型数据比较的新基准,旨在通过高质量数据集提高模型性能。
  • 研究团队发现基于模型的过滤是构建高质量训练集的关键。
  • DCLM-7B在MMLU基准上5-shot准确率达到64%,计算量仅为Llama 3 8B的1/6。
  • DCLM-7B在53个自然语言理解任务上的表现与Mistral-7B和Llama 3 8B相媲美。
  • 大部分其他模型虽然开放权重但封闭数据,DCLM因此被视为真正开源。
➡️

继续阅读