机器之心 ·

交大O1医疗探索：延长AI思考时间，解锁复杂推理诊断

💡 原文中文，约5900字，阅读约需14分钟。

📝

内容提要

上海交通大学研究表明，延长AI推理时间可显著提升医疗诊断能力，准确率提高6%-11%。AI通过系统分析症状，逐步排除不符合的诊断选项，表现接近专业医生。这一方法在真实医疗场景中取得良好效果，为AI的临床应用提供新思路。

🎯

🔎

研究表明，延长AI的推理时间能够显著提高医疗诊断的准确性。这一发现强调了在处理复杂病例时，AI需要更多的时间进行深入分析，类似于人类医生的思维过程。这为未来AI在临床应用中的发展提供了新的方向，尤其是在复杂医疗问题的解决上。

实验结果显示，推理时间的延长与模型性能之间存在密切关系。较大的模型在推理时间增加时通常能获得更好的性能，而较小模型则可能因推理时间的增加而表现下降。这提示我们在选择AI模型时，需要考虑模型的规模与推理时间的平衡，以确保最佳的诊断效果。

研究团队将所有代码和数据集开源，旨在促进医疗AI的开放发展。这一举措不仅有助于其他研究者验证和扩展该研究的成果，也为医疗AI的进一步创新提供了基础。开源资源的共享将推动整个领域的进步，提升医疗诊断的效率和准确性。

❓

延长AI推理时间可显著提升医疗诊断能力，准确率提高6%-11%。

AI通过系统分析症状，逐步排除不符合的诊断选项，模拟医生的思维方式。

团队选择了JAMA临床挑战、Medbullets和MedQA三个基准数据集进行测试。

推理时间的扩展在识别和分析关键信息方面贡献显著，尤其在复杂医疗问题中。

LongMonolog在Medbullets和MedQA数据集上表现更高，但在JAMA数据集上未能保持优势。

研究团队已将所有代码和数据集在GitHub上开源，以促进医疗AI的开放发展。

🏷️