量子位 ·

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

OpenAI的新研究表明，增加推理时间可以显著提高模型对抗攻击的稳健性，减少对对抗性训练的依赖。实验结果显示，推理计算增加后，模型抵御攻击的成功率提升，尤其在多种攻击方式下表现良好。但研究也指出该方法存在局限性，需进一步探索。

🎯

❓

研究表明，增加推理时间可以显著提高模型对抗攻击的稳健性，减少对对抗性训练的依赖。

随着推理时计算的增加，模型抵御攻击的成功率普遍提高，尤其在多种攻击方式下表现良好。

研究考察了Many-shot攻击、Soft token攻击、Think less攻击、Nerd-sniping攻击和人类/AI红队攻击等多种攻击方式。

研究者指出，当前方法在面对利用策略模糊性或漏洞的攻击时，增加计算量可能无效。

Think less攻击旨在降低模型的推理时计算量，而Nerd-sniping攻击则是诱导模型在无谓的地方耗费算力。

研究者对未来方向感到兴奋，尽管没有完全解决对抗稳健性问题，但为进一步探索提供了新的思路。

🏷️

埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
AWS与OpenAI在Bedrock上合作，但Trainium才是真正的焦点
AWS宣布与OpenAI和Anthropic达成长期合作，推出新产品Bedrock，整合GPT-5和Codex，提升云端AI推理能力。两家公司将使用AWS...
Tumbler Ridge家庭起诉OpenAI，指控其未向警方通报嫌疑人使用ChatGPT的活动
七个在加拿大Tumbler Ridge学校枪击事件中受害的家庭起诉OpenAI及其首席执行官Sam Altman，指控其未能向警方报告嫌疑人使用ChatG...
ChatGPT下载量放缓——这可能会给OpenAI的IPO带来问题
ChatGPT的用户增长放缓，尤其是与竞争对手Claude相比。根据Sensor Tower的数据，ChatGPT在4月的卸载率同比增长413%。尽管用户...
在线教程丨高性能与易部署兼得，DeepSeek-V4-Flash模型参数284B，简单任务可媲美1.6T Pro版模型
DeepSeek V4 最近发布，分为 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本。Pro 版本参数达到 1.6T，...
面向电商直播场景的全模态大模型推理加速方案
本文介绍了电商直播场景下的全模态理解大模型TLiveOmni在vLLM框架下的推理部署与量化优化。通过自定义插件和修复多模态Token排布，解决了vLLM...