该研究提出了一种自动评估框架,用于评估大型语言模型(LLMs)在医疗诊断中的能力。通过微调和多模态评估,研究显示LLMs在医学领域的应用潜力,并强调伦理监管和优化的重要性。同时,研究探讨了LLMs对临床医师信任和技能的影响,指出过度依赖LLMs可能导致诊断能力下降。
完成下面两步后,将自动完成登录并继续当前操作。