击败GPT4-Turbo,最强开源代码模型DeepSeek-Coder-V2问世

💡 原文中文,约1000字,阅读约需3分钟。
📝

内容提要

深度求索开源了DeepSeek-Coder-V2模型,是全球首个在代码、数学能力上超越GPT-4-Turbo等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,支持338种编程语言。SiliconCloud上线了DeepSeek-Coder-V2开源模型,并提供大模型推理加速服务。新用户还送1亿token。

🎯

关键要点

  • 深度求索于6月17日开源DeepSeek-Coder-V2模型。
  • DeepSeek-Coder-V2是全球首个在代码和数学能力上超越GPT-4-Turbo等的开源代码大模型。
  • 该模型包含236B与16B两种参数规模,支持338种编程语言。
  • DeepSeek-Coder-V2沿用DeepSeek-V2的MoE模型结构,总参数236B,激活参数21B。
  • 在代码和数学能力上,DeepSeek-Coder-V2在多个榜单上位居全球第二。
  • DeepSeek-Coder-V2在中英通用能力上位列国内第一梯队。
  • DeepSeek-V2擅长文本创作和角色扮演,而DeepSeek-Coder-V2擅长代码生成和数学计算。
  • SiliconCloud上线了DeepSeek-Coder-V2开源模型,并提供大模型推理加速服务。
  • 新用户可获得1亿token,提升使用体验。
➡️

继续阅读