FreeBuf网络安全行业门户 ·

思科研究发现DeepSeek R1极易受有害提示影响

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

中国初创公司DeepSeek推出的语言模型DeepSeek R1在性能上与OpenAI的o1相当，但存在严重的安全缺陷，攻击成功率高达100%。研究表明，该模型在防止有害提示方面效果不佳，可能导致滥用风险。

🎯

关键要点

中国初创公司DeepSeek推出的DeepSeek R1语言模型在性能上与OpenAI的o1相当。
DeepSeek R1的成本仅为OpenAI模型的一小部分，在数学、编码和科学推理等任务上表现优于Claude 3.5 Sonnet和ChatGPT-4o。
研究显示DeepSeek R1存在严重的安全缺陷，攻击成功率高达100%。
研究团队使用自动越狱算法测试DeepSeek R1，结果未能阻止任何有害提示。
与其他领先模型相比，DeepSeek R1缺乏有效的防护措施，极易受到算法越狱和潜在滥用的影响。
DeepSeek的AI开发策略包括思维链提示、强化学习和蒸馏，但可能损害模型的安全性。

❓

延伸问答

DeepSeek R1与OpenAI的o1相比有什么优势？

DeepSeek R1在成本上仅为OpenAI模型的一小部分，并且在数学、编码和科学推理等任务上表现优于Claude 3.5 Sonnet和ChatGPT-4o。

DeepSeek R1的安全缺陷是什么？

DeepSeek R1存在严重的安全缺陷，攻击成功率高达100%，未能阻止任何有害提示。

研究团队是如何测试DeepSeek R1的安全性的？

研究团队使用自动越狱算法测试DeepSeek R1，应用了来自HarmBench数据集的50个提示，评估攻击成功率。

DeepSeek的AI开发策略有哪些？

DeepSeek的AI开发策略包括思维链提示、强化学习和蒸馏，这些策略增强了其模型的推理效率。

DeepSeek R1的攻击成功率与其他模型相比如何？

DeepSeek R1的攻击成功率为100%，而其他领先模型至少表现出一定程度的抵抗力。

DeepSeek R1的安全性问题可能导致什么后果？

DeepSeek R1的安全性问题可能导致模型被滥用，增加网络犯罪和虚假信息传播的风险。

🏷️

继续阅读

OpenAI的新安全模型仅面向‘关键网络防御者’
OpenAI即将推出新的网络安全模型GPT-5.5-Cyber，首批仅向“可信的网络防御者”发布。CEO萨姆·阿尔特曼表示，此次有限发布旨在增强机构的网络...
本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集
Privacy Filter 是 OpenAI 开源的双向标记分类模型，专门用于检测和屏蔽文本中的个人身份信息。该模型基于小型预训练架构，采用高效的片段解码方式。
早报｜苹果iOS 27或大幅升级照片App/曝一加、realme正式合并/去年我国Token调用量达21100万亿
马斯克与OpenAI的官司已开庭，马斯克指控OpenAI盗用慈善机构，索赔超过1500亿美元。他自称是OpenAI的实际推动者，但表现不如预期。OpenA...
埃隆·马斯克在法庭上的最大敌人是他自己
在法庭上，埃隆·马斯克的证词表现不佳，尤其在交叉询问中显得情绪化和不一致。他指责OpenAI“盗窃慈善”，对其盈利模式感到失望，并表示曾希望控制OpenA...
马斯克诉奥特曼案中迄今揭示的所有证据
马斯克与奥特曼的诉讼揭示了OpenAI早期的内部邮件和文件。马斯克指控奥特曼等人违反慈善信托，质疑OpenAI是否偏离了其造福全人类的初衷。邮件显示，马斯...
埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...