o3-mini vs DeepSeek-R1: Which One is Safer?

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究评估了大型语言模型(LLMs)的安全性,比较了DeepSeek-R1和o3-mini模型。使用ASTRAL工具生成1260个不安全测试输入,结果显示o3-mini的不安全回答率为1.19%,而DeepSeek-R1高达11.98%。研究揭示了LLMs在安全性上的显著差异,对行业安全标准的建立具有重要影响。

🎯

关键要点

  • 本研究评估了大型语言模型(LLMs)的安全性,特别比较了DeepSeek-R1和o3-mini模型。
  • 使用ASTRAL工具生成并执行了1260个不安全测试输入。
  • o3-mini的不安全回答率为1.19%,而DeepSeek-R1高达11.98%。
  • 研究揭示了LLMs在安全性上的显著差异,对行业安全标准的建立具有重要影响。
➡️

继续阅读