Gemma 3 技术报告

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究推出了Gemma 3,一个参数规模从10亿到270亿的多模态模型。其创新架构有效降低了长上下文的内存消耗,并显著提升了数学、对话、指令遵循和多语言能力。

🎯

关键要点

  • 推出了Gemma 3,一个参数规模从10亿到270亿的多模态模型。
  • 创新架构有效降低了长上下文的内存消耗。
  • 显著提升了数学、对话、指令遵循和多语言能力。
  • 模型在多个基准测试中表现出色。
➡️

继续阅读