谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解

💡 原文中文,约1600字,阅读约需4分钟。
📝

内容提要

在2025年Google I/O大会上,CEO Sundar Pichai介绍了面向医疗领域的开源模型MedGemma,该模型基于Gemma 3,提供40亿和270亿参数的版本,能够处理医学文本和图像,支持病人问诊和分诊等任务。

🎯

关键要点

  • 在2025年Google I/O大会上,CEO Sundar Pichai介绍了面向医疗领域的开源模型MedGemma。
  • MedGemma基于Gemma 3构建,提供40亿和270亿参数的版本。
  • MedGemma能够处理医学文本和图像,支持病人问诊和分诊等任务。
  • MedGemma 4B多模态版本采用SigLIP图像编码器,使用去标识化的医学图像进行预训练。
  • MedGemma 27B专门在医学文本上进行训练,并优化推理阶段的计算。
  • HyperAI官网上线了MedGemma-27b-text-it医学推理大模型的教程,用户可体验AI医生问诊。
  • 新注册用户使用邀请码「MedGemma」可获得4小时RTX A6000免费使用时长。
  • 官网还上线了II-Medical-8B医学推理大模型的教程,基于Qwen3-8B进行微调。
  • 用户可通过HyperAI平台一键部署MedGemma模型,体验其强大能力。
  • MedGemma能够提供针对症状的不同解决办法和可能的病因。

延伸问答

MedGemma是什么?

MedGemma是谷歌推出的面向医疗领域的开源模型,基于Gemma 3构建,能够处理医学文本和图像。

MedGemma有哪些版本?

MedGemma提供40亿参数的多模态版本和270亿参数的纯文本版本。

MedGemma能完成哪些任务?

MedGemma能够完成病人问诊、分诊、临床决策支持和医疗文本摘要等任务。

如何体验MedGemma的功能?

用户可以通过HyperAI官网的一键部署教程体验MedGemma的功能。

新用户注册MedGemma有什么优惠?

新注册用户使用邀请码「MedGemma」可获得4小时RTX A6000的免费使用时长。

MedGemma的多模态版本使用了什么技术?

MedGemma的多模态版本采用了SigLIP图像编码器,使用去标识化的医学图像进行预训练。

➡️

继续阅读