小红花·文摘

该研究提出了一种自动评估框架，用于评估大型语言模型（LLMs）在医疗诊断中的能力。通过微调和多模态评估，研究显示LLMs在医学领域的应用潜力，并强调伦理监管和优化的重要性。同时，研究探讨了LLMs对临床医师信任和技能的影响，指出过度依赖LLMs可能导致诊断能力下降。