InfoQ ·

Gemma 3n引入新技术以增强移动AI推理

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

Gemma 3n正式发布，专注于移动设备的AI应用。采用Per-Layer Embeddings技术减少RAM需求，同时保持参数数量。MatFormer技术支持模型嵌套，允许选择完整模型或子模型。此外，Gemma 3n引入KV缓存共享，加速推理时间，并具备音频和视频编码能力，支持自动语音识别和翻译。

🎯

关键要点

Gemma 3n正式发布，专注于移动设备的AI应用。
采用Per-Layer Embeddings技术减少RAM需求，同时保持参数数量。
5亿参数模型仅需加载20亿参数，8亿参数模型需加载40亿参数。
MatFormer技术支持模型嵌套，允许选择完整模型或子模型。
支持动态切换全模型和子模型，适应当前任务和设备负载。
引入KV缓存共享，加速推理时间，提升预填性能2倍。
具备音频和视频编码能力，支持自动语音识别和翻译。
音频编码器每160毫秒生成一个token，提供声音上下文的细粒度表示。
支持英语与西班牙语、法语、意大利语和葡萄牙语之间的翻译。
支持256x256、512x512和768x768像素的分辨率，处理速度可达每秒60帧。
与Gemma 3相比，量化后速度提升13倍，内存占用减少四倍。

🏷️

继续阅读

AI Infra Brief｜千亿级合作与推理加速（2026.03.06）
2026年3月6日，AI基础设施迎来多项合作：AMD与Meta签署1000亿美元算力协议，推理成本降低86%；CoreWeave部署NVIDIA GB20...
一分钟读论文：《ICLR2026新CAGE技术破解跨文化AI安全测试难题》
CAGE技术由韩国SelectStar公司研发，旨在解决AI安全测试中的文化偏见问题。它通过“语义模具”方法自动生成适应不同文化的红队测试数据，显著提升小...
llmfit – 1秒测出：你的电脑能跑哪些 AI 大模型
llmfit 是一款跨平台工具，能够快速检测电脑硬件并列出可运行的 AI 大模型，提供模型评分和推理速度等信息。其优势在于隐私保护、低成本和离线使用，适合...
高中生AI创业，现在只招龙虾员工：每月成本2800
一名高中生创业，利用AI和龙虾员工运营公司，每月成本仅400美元，已吸引450+付费用户。公司结构完整，龙虾负责设计、开发和内容等任务，通过提示词与AI高效协作。
数据分析显示谷歌AI概览功能抢占网站自然搜索流量部分网站流量暴跌97%
谷歌的AI概览功能导致部分网站自然搜索流量下降高达97%。虽然AI能节省用户时间，但也可能提供错误信息。流量下降的原因包括用户搜索频率降低和Reddit排...
扫地机器人，正式迈入AI时代？
来源 | 伯虎财经（bohuFN）作者 | 林恩近日，石头科技发布年度业绩快报。透过财报，我们看到，智能清洁家电行业正在经历一场深刻的变革。一边是行业增速...

Gemma 3n引入新技术以增强移动AI推理

内容提要

关键要点

标签

继续阅读