小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

第三方评测机构Artificial Analysis发布报告称,Qwen3.5 27B和Gemma 4 31B在智能水平上接近GPT-5。Qwen3.5在推理能力上表现优异,但知识准确性仍有不足。两款模型支持多模态输入,适合本地部署,降低使用门槛。Gemma 4系列在多种应用场景中表现出色,具备强大的推理和语言处理能力。

教程汇总丨开源小模型综合智能水平追平GPT-5,一站测评Qwen 3.5/Gemma 4等热门模型

HyperAI超神经
HyperAI超神经 · 2026-04-17T05:04:36Z
如何使用Gemma 4和Python实现工具调用

本文介绍了如何使用Gemma 4模型和Python构建本地隐私优先的工具调用代理。Gemma 4模型支持与外部功能交互,生成结构化JSON输出并调用函数。通过Ollama和gemma4:e2b模型,可以在移动设备上高效实现工具调用,确保数据隐私。文章提供示例代码,展示如何定义工具函数并与语言模型交互,实现实时天气查询和新闻获取等功能。

如何使用Gemma 4和Python实现工具调用

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-13T20:00:43Z
M4 MacBook Air上玩转OpenClaw+本地Gemma 4经验分享

在M4 MacBook Air上运行Gemma 4体验流畅,无需API密钥,普通用户可轻松安装使用。本地运行消除了费用和隐私顾虑,用户可自由提问。尽管性能有限,但其安静和低能耗特点适合日常使用,表明本地AI技术逐渐融入普通生活。

M4 MacBook Air上玩转OpenClaw+本地Gemma 4经验分享

极道
极道 · 2026-04-09T00:30:00Z
甲骨文 ARM 实例部署 Gemma 4 模型

本文介绍了一种在Oracle ARM硬件上运行的大型语言模型(MoE),该模型拥有260亿参数,但每次生成仅激活40亿参数。性能估计显示,输入处理速度为150-400个令牌每秒,输出生成速度为3-8个令牌每秒,主要受内存带宽限制。建议通过优化线程设置和使用Flash Attention来提高效率。

甲骨文 ARM 实例部署 Gemma 4 模型

Dejavu's Blog
Dejavu's Blog · 2026-04-07T04:11:45Z

谷歌推出Gemma 4系列模型,基于Gemini 3技术,体积小巧,适用于智能手机等边缘设备。该模型支持多模态输入,优化了参数效率和上下文长度,性能接近Kimi-K2.5。Gemma 4采用Apache 2.0开源许可证,允许商业使用,旨在为安卓设备的AI化做好准备。

谷歌开源发布Gemma 4系列模型 体积更小但提供类似Kimi-K2.5的智能

蓝点网
蓝点网 · 2026-04-03T01:40:25Z

Google于4月2日发布了开源模型Gemma 4,强调参数效率和本地运行能力,支持多种设备和语言,具备多模态处理能力,适用于Agent工作流开发。该模型采用Apache 2.0许可证,兼容主流工具链,推动AI在移动端和边缘计算的应用。

派早报:Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等

少数派
少数派 · 2026-04-03T00:39:38Z
从RTX到Spark:NVIDIA加速Gemma 4以实现本地智能AI

谷歌Gemma 4系列推出小型高效模型,优化NVIDIA GPU性能,支持推理、编码和多模态交互,适用于边缘设备和高性能GPU,推动本地智能助手的发展。

从RTX到Spark:NVIDIA加速Gemma 4以实现本地智能AI

NVIDIA Blog
NVIDIA Blog · 2026-04-02T16:15:58Z
AI Gateway上的Gemma 4

谷歌的Gemma 4 26B(MoE)和31B(Dense)模型已在Vercel AI Gateway上发布。这两个模型基于Gemini 3架构,支持函数调用和结构化JSON输出。26B模型在推理时激活3.8B参数,优化延迟;31B模型激活所有参数,适合高质量输出。用户可在AI SDK中选择模型,AI Gateway提供统一API以便于调用和性能优化。

AI Gateway上的Gemma 4

Vercel News
Vercel News · 2026-04-02T07:00:00Z
Modular:零日发布:Gemma 4在NVIDIA和AMD上的最快性能

谷歌DeepMind发布了Gemma 4系列模型,支持文本、图像和视频,具有256K上下文窗口,适用于复杂任务。Modular Cloud优化了Gemma 4的性能,提供高效的API接口,支持NVIDIA和AMD硬件,确保无缝扩展。

Modular:零日发布:Gemma 4在NVIDIA和AMD上的最快性能

Modular Blog
Modular Blog · 2026-04-02T00:00:00Z
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

开源模型迭代迅速,开发者希望低门槛部署新模型,但GPU成本和环境配置仍是障碍。HyperAI提供免费CPU配额和在线教程,帮助开发者快速体验模型。

在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

HyperAI超神经
HyperAI超神经 · 2026-03-10T03:46:25Z
谷歌发布Gemma 3 270M变体,优化移动和边缘设备上的函数调用

FunctionGemma是Gemma 3 270M的轻量版,能够将自然语言转换为结构化函数和API调用,支持本地运行,适合私密任务和复杂请求的智能路由。该模型在移动设备上高效运行,准确率从58%提升至85%。FunctionGemma支持多种框架的微调,并提供多个演示应用,帮助开发者定制模型。

谷歌发布Gemma 3 270M变体,优化移动和边缘设备上的函数调用

InfoQ
InfoQ · 2026-01-26T10:00:00Z

Gemma是新推出的开放翻译模型,支持55种语言,提供三种参数规模(4B、12B和27B)。其12B模型在翻译质量上超越27B,效率显著提升,适合移动设备和本地开发。经过两阶段微调,确保高质量翻译,推动语言交流。

TranslateGemma:一套新的开放翻译模型

The Keyword
The Keyword · 2026-01-15T17:00:00Z

Gemma 3n影响挑战赛获奖项目包括:第一名Gemma Vision为视障人士提供AI助手;第二名Vite Vere帮助认知障碍者独立生活;第三名3VA改善沟通;第四名安全监控系统提升威胁识别,展示了AI在各领域的应用潜力。

这些开发者正在通过Gemma 3n改变生活

The Keyword
The Keyword · 2025-12-10T17:15:00Z
被美国共和党参议员投诉后谷歌从AI工作室撤掉其开源人工智能模型Gemma

因共和党参议员玛莎·布莱克本投诉,谷歌撤下了开源AI模型Gemma,该模型捏造了对她的虚假指控。布莱克本要求谷歌解释原因,但谷歌未作公开说明。生成式AI常在用户引导下产生虚假信息。

被美国共和党参议员投诉后谷歌从AI工作室撤掉其开源人工智能模型Gemma

蓝点网
蓝点网 · 2025-11-04T00:24:57Z
谷歌在参议员指控其捏造攻击指控后撤回AI模型

因共和党参议员布莱克本投诉,谷歌已从AI Studio平台撤回AI模型Gemma。布莱克曼指控该模型捏造对她的严重犯罪指控。谷歌表示Gemma是为开发者设计的工具,不应回答事实问题。尽管承诺改进模型,AI生成虚假信息的问题仍未解决。布莱克曼要求谷歌在控制模型前关闭其访问。

谷歌在参议员指控其捏造攻击指控后撤回AI模型

The Verge
The Verge · 2025-11-03T11:40:40Z

谷歌DeepMind与耶鲁大学合作推出C2S-Scale模型,发现新药物组合可能增强肿瘤对免疫系统的可见性。该模型成功验证了silmitasertib与干扰素的协同效应,提升了抗原呈现,为癌症治疗提供了新途径。

Gemma模型如何帮助发现新的潜在癌症治疗途径

Google DeepMind Blog
Google DeepMind Blog · 2025-10-23T18:22:55Z

研究人员利用C2S-Scale 27B模型发现CK2抑制剂silmitasertib在低干扰素环境下能显著增强抗原呈现,实验验证了其与低剂量干扰素联用可提高肿瘤被免疫系统识别的能力,为新疗法开发提供了重要线索。

Gemma模型如何帮助发现新的潜在癌症治疗途径

Google DeepMind Blog
Google DeepMind Blog · 2025-10-16T12:00:00Z

Google推出了轻量级指令微调模型Gemma-3-270M-IT,参数仅2.7亿,适合低算力环境,支持32K tokens上下文,解决了大模型的响应延迟和上下文丢失问题,满足高效对话需求。

270M轻量模型!Gemma-3-270M-IT 专注轻量化长文本交互;跨平台GUI智能体首选!AgentNet覆盖200+网站

HyperAI超神经
HyperAI超神经 · 2025-09-01T03:11:24Z

机器之心数据服务正式上线,提供高效稳定的数据获取,简化数据爬取流程。

谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

机器之心
机器之心 · 2025-08-15T05:09:09Z
Gemma 3n引入新技术以增强移动AI推理

Gemma 3n正式发布,专注于移动设备的AI应用。采用Per-Layer Embeddings技术减少RAM需求,同时保持参数数量。MatFormer技术支持模型嵌套,允许选择完整模型或子模型。此外,Gemma 3n引入KV缓存共享,加速推理时间,并具备音频和视频编码能力,支持自动语音识别和翻译。

Gemma 3n引入新技术以增强移动AI推理

InfoQ
InfoQ · 2025-07-04T18:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码