医学中大型语言模型的对抗攻击
原文中文,约500字,阅读约需1分钟。发表于: 。大型语言模型(LLMs)在医疗应用中的整合为医学诊断、治疗建议和患者护理方面的进步提供了有希望的前景,然而,LLMs 对敌对攻击的易受攻击性构成了重大威胁,可能导致敏感医疗环境中的不良结果。本研究调查了 LLMs 在三个医学任务中面临的两种类型的敌对攻击的易受攻击性。利用真实的患者数据,我们证明了开源和专有的 LLMs...
大型语言模型(LLMs)在医疗应用中的整合为医学诊断、治疗建议和患者护理方面的进步提供了有希望的前景。然而,LLMs易受敌对攻击,可能导致敏感医疗环境中的不良结果。本研究调查了LLMs在三个医学任务中面临的敌对攻击的易受攻击性。研究发现,模型微调需要更多的敌对数据以实施有效的攻击。这项研究强调了在医疗应用中确保LLMs安全有效部署的迫切需求。