小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Gemma 4最近发布了优化的量化感知训练(QAT)检查点,提升了模型在移动设备上的效率,减少了压缩时的质量损失,显著降低了内存占用,适合在日常边缘设备上运行。新模型支持多种开发工具,用户可轻松下载和部署。

Gemma 4 QAT模型:优化移动设备和笔记本电脑的模型压缩效率

The Keyword
The Keyword · 2026-06-05T16:00:00Z
谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行

谷歌推出了Gemma 4 12B模型,旨在为标准笔记本电脑提供高性能的多模态智能。该模型内存占用比Gemma 4 26B小一半,但性能接近,支持本地运行,适合开发者使用。其统一架构可直接处理音频和图像输入,减少延迟和内存使用,吸引了开发者的关注。

谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行

The New Stack
The New Stack · 2026-06-04T19:30:19Z
谷歌发布并开源Gemma 4 12B版多模态模型 可在16GB内存/显存上运行

谷歌发布了Gemma 4 12B多模态模型,支持文本、图片、视频和音频输入,能够在仅16GB内存的消费级设备上运行。该模型采用无编码器架构,降低延迟并简化输入处理,智能化程度接近Gemma 26B版。开发者可在多个平台体验和下载该模型。

谷歌发布并开源Gemma 4 12B版多模态模型 可在16GB内存/显存上运行

蓝点网
蓝点网 · 2026-06-04T04:00:42Z
本地多模态拳王Gemma 4 12B评测 | 无编码器架构详解

谷歌最新的Gemma 4 12B是一款轻量级多模态AI模型,采用无编码器架构,能够直接处理图像和音频,提升了效率和理解能力。其120亿参数使其在普通电脑上运行成为可能,具备高效、快速的响应能力,并支持本地运行,确保隐私和安全。Gemma 4 12B适合个人用户和开发者,具有极高的可定制性。

本地多模态拳王Gemma 4 12B评测 | 无编码器架构详解

极道
极道 · 2026-06-03T23:29:00Z
构建具有错误恢复功能的多工具Gemma 4代理

本文介绍了构建具有错误恢复功能的多工具Gemma 4代理的方法。重点包括设计迭代代理循环、处理工具调用中的四种失败类型,以及创建有效的错误消息以帮助模型恢复。通过捕获错误并转化为可读消息,模型能够决定是否重试或解释失败,从而提高代理的鲁棒性,最终实现一个能够优雅处理问题的代理系统。

构建具有错误恢复功能的多工具Gemma 4代理

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-26T12:00:51Z

本文介绍了为Gemma 4模型添加的两个新工具:沙盒文件系统浏览器和受限的Python解释器。这些工具使模型能够自主检查环境和执行代码,从而提升其代理性。文章详细阐述了工具的设计、安全性考虑及实际应用测试,展示了模型如何有效处理信息和进行计算。

Gemma 4的简易代理工具调用

KDnuggets
KDnuggets · 2026-05-22T12:00:22Z
2026年5月10日Python中心周刊摘要

本周Python的热门话题包括2026年构建Python库、选择Python日志库以及Google DeepMind的Gemma开源LLM库。讨论了使用Python标准库进行HTTP GET请求、构建低延迟语音代理和多线程的深入分析。此外,新项目如开源ML工程师ml-intern和pip 26.1也受到关注。

2026年5月10日Python中心周刊摘要

Python Hub Weekly
Python Hub Weekly · 2026-05-10T18:00:00Z

Gemma 4推出了多令牌预测(MTP)模型,采用专门的推测解码架构,实现了三倍的速度提升,同时保持输出质量不变。MTP通过将重型目标模型与轻型草拟模型配对,减少延迟,提升AI应用在本地和边缘设备上的性能。MTP草拟器现已开源,开发者可在Hugging Face等平台下载和实验。

加速Gemma 4:通过多令牌预测草拟器实现更快的推理

The Keyword
The Keyword · 2026-05-05T16:00:00Z
浏览器里跑 Gemma 4:不用 API、不花钱,无限量生成 Excalidraw 流程图

Gemma 4 现已支持在手机和浏览器上运行,开发者利用 Google 的 TurboQuant 算法将其集成。用户可以在 Excalidraw 中本地生成图形,无需在线模型和 Token,只需下载 3.1GB 的模型。TurboQuant 算法压缩 KV Cache,提高了模型的上下文记忆能力,支持更长对话,且节省成本,用户可无限制使用。

浏览器里跑 Gemma 4:不用 API、不花钱,无限量生成 Excalidraw 流程图

小众软件
小众软件 · 2026-04-26T05:54:46Z
教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

第三方评测机构Artificial Analysis发布报告称,Qwen3.5 27B和Gemma 4 31B在智能水平上接近GPT-5。Qwen3.5在推理能力上表现优异,但知识准确性仍有不足。两款模型支持多模态输入,适合本地部署,降低使用门槛。Gemma 4系列在多种应用场景中表现出色,具备强大的推理和语言处理能力。

教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

HyperAI超神经
HyperAI超神经 · 2026-04-17T05:04:36Z
如何使用Gemma 4和Python实现工具调用

本文介绍了如何使用Gemma 4模型和Python构建本地隐私优先的工具调用代理。Gemma 4模型支持与外部功能交互,生成结构化JSON输出并调用函数。通过Ollama和gemma4:e2b模型,可以在移动设备上高效实现工具调用,确保数据隐私。文章提供示例代码,展示如何定义工具函数并与语言模型交互,实现实时天气查询和新闻获取等功能。

如何使用Gemma 4和Python实现工具调用

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-13T20:00:43Z
M4 MacBook Air上玩转OpenClaw+本地Gemma 4经验分享

在M4 MacBook Air上运行Gemma 4体验流畅,无需API密钥,普通用户可轻松安装使用。本地运行消除了费用和隐私顾虑,用户可自由提问。尽管性能有限,但其安静和低能耗特点适合日常使用,表明本地AI技术逐渐融入普通生活。

M4 MacBook Air上玩转OpenClaw+本地Gemma 4经验分享

极道
极道 · 2026-04-09T00:30:00Z
甲骨文 ARM 实例部署 Gemma 4 模型

本文介绍了一种在Oracle ARM硬件上运行的大型语言模型(MoE),该模型拥有260亿参数,但每次生成仅激活40亿参数。性能估计显示,输入处理速度为150-400个令牌每秒,输出生成速度为3-8个令牌每秒,主要受内存带宽限制。建议通过优化线程设置和使用Flash Attention来提高效率。

甲骨文 ARM 实例部署 Gemma 4 模型

Dejavu's Blog
Dejavu's Blog · 2026-04-07T04:11:45Z

谷歌推出Gemma 4系列模型,基于Gemini 3技术,体积小巧,适用于智能手机等边缘设备。该模型支持多模态输入,优化了参数效率和上下文长度,性能接近Kimi-K2.5。Gemma 4采用Apache 2.0开源许可证,允许商业使用,旨在为安卓设备的AI化做好准备。

谷歌开源发布Gemma 4系列模型 体积更小但提供类似Kimi-K2.5的智能

蓝点网
蓝点网 · 2026-04-03T01:40:25Z

Google于4月2日发布了开源模型Gemma 4,强调参数效率和本地运行能力,支持多种设备和语言,具备多模态处理能力,适用于Agent工作流开发。该模型采用Apache 2.0许可证,兼容主流工具链,推动AI在移动端和边缘计算的应用。

派早报:Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等

少数派
少数派 · 2026-04-03T00:39:38Z
从RTX到Spark:NVIDIA加速Gemma 4以实现本地智能AI

谷歌Gemma 4系列推出小型高效模型,优化NVIDIA GPU性能,支持推理、编码和多模态交互,适用于边缘设备和高性能GPU,推动本地智能助手的发展。

从RTX到Spark:NVIDIA加速Gemma 4以实现本地智能AI

NVIDIA Blog
NVIDIA Blog · 2026-04-02T16:15:58Z
AI Gateway上的Gemma 4

谷歌的Gemma 4 26B(MoE)和31B(Dense)模型已在Vercel AI Gateway上发布。这两个模型基于Gemini 3架构,支持函数调用和结构化JSON输出。26B模型在推理时激活3.8B参数,优化延迟;31B模型激活所有参数,适合高质量输出。用户可在AI SDK中选择模型,AI Gateway提供统一API以便于调用和性能优化。

AI Gateway上的Gemma 4

Vercel News
Vercel News · 2026-04-02T07:00:00Z
Modular:零日发布:Gemma 4在NVIDIA和AMD上的最快性能

谷歌DeepMind发布了Gemma 4系列模型,支持文本、图像和视频,具有256K上下文窗口,适用于复杂任务。Modular Cloud优化了Gemma 4的性能,提供高效的API接口,支持NVIDIA和AMD硬件,确保无缝扩展。

Modular:零日发布:Gemma 4在NVIDIA和AMD上的最快性能

Modular Blog
Modular Blog · 2026-04-02T00:00:00Z
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

开源模型迭代迅速,开发者希望低门槛部署新模型,但GPU成本和环境配置仍是障碍。HyperAI提供免费CPU配额和在线教程,帮助开发者快速体验模型。

在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

HyperAI超神经
HyperAI超神经 · 2026-03-10T03:46:25Z
谷歌发布Gemma 3 270M变体,优化移动和边缘设备上的函数调用

FunctionGemma是Gemma 3 270M的轻量版,能够将自然语言转换为结构化函数和API调用,支持本地运行,适合私密任务和复杂请求的智能路由。该模型在移动设备上高效运行,准确率从58%提升至85%。FunctionGemma支持多种框架的微调,并提供多个演示应用,帮助开发者定制模型。

谷歌发布Gemma 3 270M变体,优化移动和边缘设备上的函数调用

InfoQ
InfoQ · 2026-01-26T10:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码