从计算机视觉向医疗AI,上海交大谢伟迪发布多项成果,登Nature子刊/NeurIPS/CVPR等

💡 原文中文,约6000字,阅读约需15分钟。
📝

内容提要

近年来,AI for Science迅速发展,推动医疗和材料研究。上海交通大学谢伟迪教授专注于医学人工智能,分享团队在多模态医疗模型和开源数据集方面的成果,旨在辅助医生,提高医疗资源的普适性。

🎯

关键要点

  • 近年来,AI for Science迅速发展,推动医疗和材料研究。
  • 上海交通大学谢伟迪教授专注于医学人工智能,分享团队在多模态医疗模型和开源数据集方面的成果。
  • 医疗人工智能已成为大势所趋,旨在推进医疗资源的普适化。
  • 大语言模型在医疗领域存在局限性,无法完全替代医生。
  • 团队的目标是构建多模态通用医疗模型,支持多种输入模态。
  • 团队贡献了高质量的开源医疗数据集,涵盖文本和图像数据。
  • PMC-LLaMA是团队推出的开源医疗大语言模型,后续将持续迭代升级。
  • 团队构建了多个视觉-语言模型,并在医学影像领域取得了重要成果。
  • 通过知识图谱将医学知识注入模型,提升模型性能。
  • 谢伟迪教授在计算机视觉和医学人工智能领域有丰富的研究背景。

延伸问答

谢伟迪教授在医疗人工智能领域的主要研究方向是什么?

谢伟迪教授专注于构建多模态通用医疗模型,旨在辅助医生并提高医疗资源的普适性。

团队在开源医疗数据集方面有哪些贡献?

团队构建了包含超3万本医学书籍和480万篇论文的开源医疗数据集,并收集了多种语言的医学文本和图像数据。

PMC-LLaMA模型的特点是什么?

PMC-LLaMA是一个开源医疗大语言模型,结合了医学数据和论文数据进行自回归式训练,旨在提升医疗领域的模型性能。

医疗人工智能面临哪些局限性?

大语言模型在医疗领域存在局限性,例如无法理解ICD代码,不能像医生一样提供及时的就医指导。

团队如何提升模型的性能?

通过将医学知识注入模型,并构建知识图谱,团队提升了模型在医疗任务中的表现。

多模态通用医疗模型的输入和输出形式是什么?

该模型支持多种输入模态,如图像和音频,输出包括视觉信息和文本诊断结果。

➡️

继续阅读