小红花·文摘

本文提出了一种新的对齐算法，将视觉语言模型与医学知识结合，生成多轮医学对话。通过构建大规模医疗视觉问答数据集，显著提升了模型在视觉感知和推理方面的性能。此外，研究还介绍了情感视觉指令生成、偏好调优方法及医学图像描述生成的进展，为医疗人工智能提供了更准确的工具。