Google DeepMind 发布了新款多模态模型 Gemma 4 12B,参数为120亿,但在多项测试中表现接近260亿参数的模型。其无编码器架构显著降低了推理延迟和内存占用,支持音频输入,并可在普通笔记本上运行,降低了部署成本,为开发者提供了接近顶级性能的选择。
谷歌最新的Gemma 4 12B是一款轻量级多模态AI模型,采用无编码器架构,能够直接处理图像和音频,提升了效率和理解能力。其120亿参数使其在普通电脑上运行成为可能,具备高效、快速的响应能力,并支持本地运行,确保隐私和安全。Gemma 4 12B适合个人用户和开发者,具有极高的可定制性。
AIxiv专栏促进学术交流,报道了2000多篇内容。汤轶等人研究了无编码器架构在3D多模态模型中的应用,提出了ENEL模型,其表现优于传统编码器模型,展示了无编码器架构的潜力。
完成下面两步后,将自动完成登录并继续当前操作。