面向 LLMs 的临床能力自动评估:度量标准、数据和算法
基于大语言模型的临床能力评估范式,利用自动化评估方法来确保临床方案的安全性和可靠性。
该论文研究了临床医师对LLMs的信任和数据来源从人生成为AI生成内容的演变关系,以及LLMs对临床医师能力和准确性的影响。研究发现,LLMs对学习的依赖可能导致输出质量下降和临床医师技能减弱。此外,LLMs自我参考学习循环和医疗保健专业人员能力下降的潜在风险也被探讨。研究指出,LLMs在回音室内运行的风险可能固化偏见并降低其效力,同时对LLMs的依赖可能导致医疗保健提供者的诊断和思考能力下降。因此,需要积极对话和战略措施以确保LLM技术的安全有效使用。