小红花·文摘

本文评估了大型语言模型（LLM）在多模式指令下的能力，发现其在多轮会话中存在错误累积和鲁棒性问题。研究提出了多种提升模型鲁棒性的方法，包括使用奖励模型和构建新的数据集。实验结果显示，尽管LLM在自然语言理解和代码生成方面表现优异，但仍然面临API误用和对抗性指令的脆弱性。