研究表明,大型语言模型(如GPT-3.5、GPT-4和Claude)在医学教育中能够生成高质量的考试问题,评估指标包括可读性、特异性和清晰度,显示出这些模型在适当提示下的有效性。
完成下面两步后,将自动完成登录并继续当前操作。