BriefGPT - AI 论文速递 ·

o3-mini vs DeepSeek-R1: Which One is Safer?

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究评估了大型语言模型（LLMs）的安全性，比较了DeepSeek-R1和o3-mini模型。使用ASTRAL工具生成1260个不安全测试输入，结果显示o3-mini的不安全回答率为1.19%，而DeepSeek-R1高达11.98%。研究揭示了LLMs在安全性上的显著差异，对行业安全标准的建立具有重要影响。

🎯

关键要点

本研究评估了大型语言模型（LLMs）的安全性，特别比较了DeepSeek-R1和o3-mini模型。
使用ASTRAL工具生成并执行了1260个不安全测试输入。
o3-mini的不安全回答率为1.19%，而DeepSeek-R1高达11.98%。
研究揭示了LLMs在安全性上的显著差异，对行业安全标准的建立具有重要影响。

🏷️

继续阅读

电通团队发布最新《体育与娱乐趋势：真诚，自有引力》
(全球TMT 2026年07月29日讯) 电通体育与娱乐（dentsu Sports & Entert […]
产教融合落地标杆｜华为云×上海交通大学CloudRobo具身智能训练营圆满收官
作为华为云首批具身智能高校合作单位，上海交通大学与华为云依托CloudRobo平台，开放专属算力、数据集与模型资产，配套全国性学科赛事，构建起“课堂教学+...
博客是否属于“公共空间”？对公开的内容要有预见性
最近看了莫比乌斯的一篇文章，文章结尾发出了一个问题：博客是否属于“公共空间”？广义的博客是分享，记录，发表观点 […]
ZEGO即时通讯SDK发布3.1.0版本，新增会话级消息定时销毁和消息回执新增已送达状态功能
近日，ZEGO 即时通讯SDK（ZIM） 3.1.0 版本发布，新增会话级消息定时销毁和消息回执新增已送达状态。会话级消息定时销毁功能概述设置会话消息...
亚马逊登顶《财富》最新世界500强；苹果市值触及5万亿美元；SK海力士二季度营业利润增长六倍
(全球TMT 2026年07月29日讯)今日要点：亚马逊登顶《财富》最新世界500强；苹果市值触及5万亿美元； […]
使用 Amazon Bedrock AgentCore 构建企业级 MCP 服务器：四种架构模式的实践指南
随着人工智能越来越深入地集成到企业工作流程中，企业对标准化、安全且可扩展的 AI 工具平台的需求日益增长。由 Anthropic 开发的模型上下文协议 (...

内容提要

关键要点

标签

继续阅读