InfoQ ·

Gemma 3支持视觉语言理解、长上下文处理和改进的多语言能力

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

谷歌开源的生成性人工智能模型Gemma 3具备视觉语言理解、长上下文处理和多语言能力。新特性包括减少的KV缓存内存、自定义Sigmoid损失的视觉编码器，以及改进的图像处理算法。Gemma 3支持高达128k的上下文，性能优于前代模型，适合单个消费者GPU或TPU主机。

🎯

🏷️

AI 时代的新王座：为什么说 Go 可能是开发 AI Agent 的最佳语言？
随着AI应用的发展，Go语言因其高并发、易于部署和跨平台能力，逐渐成为AI代理开发的首选。尽管Python在数据科学中占主导地位，Go在基础设施层面的编译...
2026年3月8日Python Hub周刊摘要
本周Python热门项目包括“knock-knock”和“awesome-copilot”。Guido van Rossum采访Thomas Wouter...
在所有马来西亚公立大学启用Gemini教育平台
马来西亚20所公立大学已启用Gemini教育平台，惠及近60万学生和7.5万教职工。教育部为4万名教师提供Google AI Pro，128,000名学生...
苹果即将推出新的高端‘超’系列产品
苹果推出了低价的MacBook Neo，并计划推出至少三款新产品，可能会加入高端“超”系列，尽管这些新产品可能不带“超”字样，但价格将高于主流产品。
使用TanStack Start快速构建Vibe代码全栈应用
近年来，应用程序构建变得更简单，尤其是通过vibe coding。然而，全栈应用程序仍需考虑文件路由、服务器功能、流式SSR和类型安全等要素。
给乙游加一个Chatbot，凭什么就敢叫AI乙游了？
前段时间，我又看见一款女性向AI陪伴产品开启了小范围内测。产品名叫《MIO》，在内测前，官方账号发过几条男主们人设建模的帖子。评论区的反应并不算热烈。零星...