Google DeepMind Blog ·

介绍Gemma 4 12B：一种统一的无编码多模态模型

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

Gemma 4 12B是谷歌DeepMind推出的新型多模态智能模型，旨在直接在笔记本电脑上运行。它采用无编码架构，集成视觉和音频输入，性能接近更大模型，但内存占用更低，适合日常硬件使用。

🎯

🔎

Gemma 4 12B采用无编码架构，直接将视觉和音频输入整合到语言模型中。这种设计不仅减少了传统模型中编码器带来的延迟，还降低了内存使用，使得在普通笔记本电脑上运行成为可能。用户可以体验到更流畅的多模态交互，尤其适合需要快速反应的应用场景。

Gemma 4 12B在Apache 2.0许可证下开放，鼓励开发者进行创新和实验。这种开放性为开发者提供了广泛的支持，能够利用现有的工具和资源，快速构建和部署多模态应用，推动技术的进一步发展。

尽管Gemma 4 12B的性能接近更大模型，但其内存占用却显著降低，适合仅有16GB内存的消费级笔记本电脑。这使得高性能的多模态智能体验不再局限于高端设备，普通用户也能享受到先进的AI技术。

❓

Gemma 4 12B采用无编码架构，集成视觉和音频输入，性能接近更大模型，但内存占用更低，适合在16GB内存的笔记本电脑上运行。

Gemma 4 12B通过无编码架构直接将视觉和音频输入整合到语言模型中，简化了处理流程，减少了延迟和内存使用。

Gemma 4 12B可以在仅有16GB内存的消费级笔记本电脑上本地运行，适合日常硬件使用。

Gemma 4 12B支持开发者通过Apache 2.0许可证进行开放访问，促进开发者生态系统的支持。

Gemma 4 12B在性能上接近更大的26B模型，但内存占用更低，适合在普通笔记本上运行，提供高效的多模态智能体验。

开发者可以通过下载预训练模型、查看开发文档和使用各种开发工具来实现本地推理和集成，支持多种开发环境。

🏷️