数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
💡
原文中文,约2400字,阅读约需6分钟。
📝
内容提要
研究表明,添加与猫相关的语句会显著提高大模型的数学错误率,错误率增加300%。DeepSeek和OpenAI的模型均受到影响,推理能力下降,Token消耗增加,猫的干扰分散了模型的注意力,导致频繁出错。
🎯
关键要点
- 研究表明,添加与猫相关的语句会显著提高大模型的数学错误率,错误率增加300%。
- DeepSeek和OpenAI的模型均受到影响,推理能力下降,Token消耗增加。
- 猫的干扰分散了模型的注意力,导致频繁出错。
- 研究者对攻击方式进行了探索,包括问题筛选、正式测试和语义筛选。
- 在DeepSeek-V3上进行的攻击成功率为35%,在DeepSeek-R1上为20%。
- 不同模型的错误率增加情况不同,DeepSeek-R1和o1错误率提升最明显。
- 实验结果显示,Token消耗也大幅增加,某些情况下甚至是原来的近7倍。
- 研究由Collinear AI团队进行,创始人Nazneen Rajani曾在Hugging Face工作。
➡️