小红花·文摘

本研究评估了大型语言模型（LLMs）的安全性，比较了DeepSeek-R1和o3-mini模型。使用ASTRAL工具生成1260个不安全测试输入，结果显示o3-mini的不安全回答率为1.19%，而DeepSeek-R1高达11.98%。研究揭示了LLMs在安全性上的显著差异，对行业安全标准的建立具有重要影响。