InfoQ ·

Gemma 3n可用于设备端推理，配合RAG和函数调用库

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

谷歌宣布Gemma 3n在LiteRT Hugging Face社区预览，支持文本、图像、视频和音频输入。该多模态小语言模型有2B和4B参数变体，适合企业使用。Gemma 3n采用选择性参数激活技术，支持高效管理，并推出量化工具以减少模型大小和延迟。此外，还发布了AI Edge On-device Function Calling SDK，允许模型执行实际操作。

🎯

关键要点

谷歌宣布Gemma 3n在LiteRT Hugging Face社区预览，支持文本、图像、视频和音频输入。
Gemma 3n有2B和4B参数变体，适合企业使用，支持微调和定制。
Gemma 3n采用选择性参数激活技术，支持高效管理。
新发布的量化工具可减少模型大小和延迟，int4量化可将语言模型大小减少2.5-4倍。
模型支持在设备上进行检索增强生成（RAG），增强语言模型的应用特定数据。
AI Edge On-device Function Calling SDK允许模型执行实际操作，支持生成结构化函数调用。
Google AI Edge Gallery是展示各种模型和支持文本、图像、音频处理的实验性应用。

🏷️

继续阅读

X/Twitter加强客户端验证导致解锁BL/未谷歌认证设备无法发帖目前已撤回封禁
社交网站X/Twitter加强客户端验证，导致许多正常用户无法通过Android/iOS客户端发帖。虽然此举旨在打击机器人，但反而影响了用户。部分用户反馈...
IIoT PostgreSQL性能范围
索引可以有效缓解IIoT查询问题。通过在tag_id和时间上设置索引，深层查询的时间可缩短至Log(t*r)。尽管数据库增大时查询速度仍会下降，但增加的时...
大模型推理资源需求计算及使用场景示例
博客自2016年成立以来，逐步接入CDN并添加功能，如音乐墙、动态和时光，至2021年更新了站点地图。
直播：JetBrains IDE 插件中的 UI 冻结及其避免方法
JetBrains可使用我的姓名、邮箱和位置信息发送通讯，并处理个人数据。我可以随时撤回同意，邮件中有退订链接。
Insiders（版本 1.111）
VS Code Insiders版本更新了多个功能，包括递归搜索指令文件、自定义代理聊天钩子、CLI会话隔离和Markdown表格改进。新命令和快捷键提升...
谷歌最新的Pixel手表价格降至历史最低
索尼WH-1000XM5耳机在亚马逊、百思买和塔吉特售价约278美元，优惠122美元。尽管发布于2022年，这款耳机依然提供卓越的音质和降噪效果，佩戴舒适...

Gemma 3n可用于设备端推理，配合RAG和函数调用库

内容提要

关键要点

标签

继续阅读