数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免

💡 原文中文,约2400字,阅读约需6分钟。
📝

内容提要

研究表明,添加与猫相关的语句会显著提高大模型的数学错误率,错误率增加300%。DeepSeek和OpenAI的模型均受到影响,推理能力下降,Token消耗增加,猫的干扰分散了模型的注意力,导致频繁出错。

🎯

关键要点

  • 研究表明,添加与猫相关的语句会显著提高大模型的数学错误率,错误率增加300%。
  • DeepSeek和OpenAI的模型均受到影响,推理能力下降,Token消耗增加。
  • 猫的干扰分散了模型的注意力,导致频繁出错。
  • 研究者对攻击方式进行了探索,包括问题筛选、正式测试和语义筛选。
  • 在DeepSeek-V3上进行的攻击成功率为35%,在DeepSeek-R1上为20%。
  • 不同模型的错误率增加情况不同,DeepSeek-R1和o1错误率提升最明显。
  • 实验结果显示,Token消耗也大幅增加,某些情况下甚至是原来的近7倍。
  • 研究由Collinear AI团队进行,创始人Nazneen Rajani曾在Hugging Face工作。
➡️

继续阅读