机器之心 ·

慢思考助力医学大语言模型突破数据瓶颈：上海交大联合上海AI Lab推出MedS3系统

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

上海交通大学与复旦大学团队开发了新型医学推理系统MedS3，采用自我进化的慢思考范式，能够细粒度验证推理过程。该系统在医疗知识问答和诊断任务中表现优异，显著超越现有模型，解决了医疗数据匮乏的问题，提升了数据利用率和推理能力。

🎯

🔎

MedS3采用的慢思考范式使得推理过程能够进行细粒度验证，这在医疗领域尤为重要。传统模型往往缺乏对推理过程的透明性，而MedS3通过自我进化的方式，确保每一步推理都可追溯和验证，从而提升了模型的可靠性和实用性。

MedS3通过运行时缩放的方法有效解决了医疗数据匮乏的问题。与以往依赖大量人工标注或特定任务数据集的模型不同，MedS3能够高效利用现有数据，显著提升数据利用率，这对于资源有限的医疗环境具有重要的现实意义。

与传统的医疗推理模型相比，MedS3在多个任务上表现出色，尤其是在长链推理能力上。传统模型往往在任务覆盖和推理能力上存在局限，而MedS3通过创新的PRM引导投票求和策略，突破了这些瓶颈，展现出更强的综合性能。

❓

MedS3系统采用自我进化的慢思考范式，能够细粒度验证推理过程，显著提升医疗知识问答和诊断任务的表现。

MedS3通过运行时缩放的方法高效利用现有医疗数据，突破数据集标注的约束，提升数据利用率。

MedS3在医疗知识问答和医疗诊断任务上显著超越现有模型，成为首个实现长链推理的大语言模型框架。

MedS3由策略模型和过程奖励模型组成，通过多种数据集进行学习和优化。

P-VS选择策略创新性融合语义一致性校验与PRM评分，提升了模型的性能和推理能力。

实验结果表明，MedS3在多个任务上领先于医疗开源模型和通用推理模型，验证了其强大的性能外推潜力。

🏷️