谷歌开源发布Gemma 4系列模型 体积更小但提供类似Kimi-K2.5的智能

💡 原文中文,约1300字,阅读约需3分钟。
📝

内容提要

谷歌推出Gemma 4系列模型,基于Gemini 3技术,体积小巧,适用于智能手机等边缘设备。该模型支持多模态输入,优化了参数效率和上下文长度,性能接近Kimi-K2.5。Gemma 4采用Apache 2.0开源许可证,允许商业使用,旨在为安卓设备的AI化做好准备。

🎯

关键要点

  • 谷歌推出Gemma 4系列模型,基于Gemini 3技术,体积小巧,适用于智能手机等边缘设备。

  • Gemma 4系列支持多模态输入,优化了参数效率和上下文长度,性能接近Kimi-K2.5。

  • Gemma 4采用Apache 2.0开源许可证,允许商业使用,支持微调和部署。

  • Gemma 4系列提供四种不同的权重,分别为E2B、E4B、26B A4B MoE和31B Dense,适用于不同的设备和需求。

  • 边缘模型E2B和E4B的上下文窗口为128K,26B与31B版支持最高256K,确保完整分析任务。

  • 所有模型支持多模态输入,包括文本、视频、图片和音频,适合实时语音理解。

  • 谷歌与高通和联发科合作,优化Gemma 4在边缘设备上的运行,降低内存和电量消耗。

  • Gemma 4系列的能力与智谱GLM-5和Kimi-K2.5相媲美,但模型尺寸更小,优化效果显著。

  • 谷歌的优化旨在为安卓设备的AI化做好准备,未来新安卓设备将可能使用Gemma系列模型提供AI支持。

延伸问答

Gemma 4系列模型的主要特点是什么?

Gemma 4系列模型体积小巧,支持多模态输入,优化了参数效率和上下文长度,性能接近Kimi-K2.5。

Gemma 4系列模型适用于哪些设备?

Gemma 4系列模型适用于智能手机和其他边缘设备,如树莓派。

Gemma 4系列模型的开源许可证是什么?

Gemma 4系列模型采用Apache 2.0开源许可证,允许商业使用、微调和部署。

Gemma 4系列模型的不同权重有什么区别?

Gemma 4系列提供E2B、E4B、26B A4B MoE和31B Dense四种权重,适用于不同的设备和需求,参数规模和功能各异。

Gemma 4系列模型如何优化边缘设备的性能?

谷歌与高通和联发科合作,优化Gemma 4在边缘设备上的运行,降低内存和电量消耗。

Gemma 4系列模型的多模态输入支持哪些类型?

Gemma 4系列模型支持文本、视频、图片和音频的多模态输入。

➡️

继续阅读