量子位 ·

让OpenAI只领先5天，百川发布推理新模型，掀翻医疗垂域开源天花板

💡 原文中文，约6400字，阅读约需16分钟。

📝

内容提要

百川推出的医疗推理模型Baichuan-M2-32B在Healthbench评测中超越OpenAI的gpt-oss-120b，成为全球领先的开源医疗模型，适合中小型医疗机构，展现出强大的医疗能力和本土化优势。

🎯

🔎

Baichuan-M2在中国临床场景中的表现优于其他模型，尤其在遵循国内医疗指南方面。这表明，针对特定地区的医疗需求进行本土化训练，可以显著提升模型的实用性和准确性。医疗机构在选择AI模型时，应考虑其对本地医疗实践的适应性。

Baichuan-M2的轻量化设计使其能够在RTX4090单卡上部署，降低了中小型医疗机构的使用门槛。这种设计不仅减少了硬件成本，还提高了模型的可扩展性，适合资源有限的医疗环境。医疗机构在引入AI技术时，应关注模型的部署成本与效率。

Baichuan-M2采用了创新的患者模拟器和Verifier系统，通过强化学习提升医疗推理能力。这种方法能够更好地模拟真实的临床决策过程，帮助模型在复杂情况下做出更准确的判断。医疗AI的发展需要不断探索如何将先进的学习算法与实际医疗场景结合。

❓

Baichuan-M2-32B在Healthbench评测中超越了OpenAI的gpt-oss-120b，成为全球领先的开源医疗模型，展现出强大的医疗能力和本土化优势。

Baichuan-M2支持RTX4090单卡部署，适合中小型医疗机构的私有部署。

Baichuan-M2通过创新的患者模拟器和Verifier系统，结合真实医疗场景进行训练，采用多阶段强化学习策略和改进的GRPO算法来提升推理能力。

Baichuan-M2在中国临床诊疗场景中表现出本土化优势，更符合国内医疗指南。

Baichuan-M2在HealthBench-Hard测试中是全球唯二超过32分的模型，表现明显优于其他开源和闭源模型。

百川已与多家医疗机构展开合作，推动AI医疗的实际落地，未来将继续深化在医疗领域的应用。

🏷️