小红花·文摘

本文研究了对现代大型语言模型（LLMs）在编码任务中的对抗性示例攻击的影响，并提出了基于提示的防御措施，实验证明对抗性示例具有可转移性，削弱了LLMs的性能，提出的防御措施显示出改善模型韧性的潜力。

BriefGPT - AI 论文速递 ·

本文研究了对现代大型语言模型（LLMs）在编码任务中的对抗性示例攻击的影响，并提出了基于提示的防御措施，实验证明对抗性示例具有可转移性，削弱了LLMs的性能，提出的防御措施显示出改善模型韧性的潜力。

BriefGPT - AI 论文速递 ·