本文提出了一种新的对齐算法,将视觉语言模型与医学知识结合,生成多轮医学对话。通过构建大规模医疗视觉问答数据集,显著提升了模型在视觉感知和推理方面的性能。此外,研究还介绍了情感视觉指令生成、偏好调优方法及医学图像描述生成的进展,为医疗人工智能提供了更准确的工具。
完成下面两步后,将自动完成登录并继续当前操作。