宝玉的分享 ·

Deep Research 系统卡（中文）

💡 原文中文，约24300字，阅读约需58分钟。

📝

内容提要

Deep Research 是一种新型智能体，能够在互联网上执行复杂的多步骤研究任务。它通过搜索和分析文本、图像及 PDF 文件进行推理，并能执行 Python 代码进行数据分析。OpenAI 对其进行了严格的安全测试和风险评估，确保隐私保护并抵御恶意指令，整体风险评估为中等，未来将继续改进安全措施。

🎯

关键要点

Deep Research 是一种新型智能体，能够在互联网上执行复杂的多步骤研究任务。
该模型基于早期版本的 OpenAI o3，专门针对网页浏览进行了优化。
Deep Research 能够搜索、解读和分析文本、图像及 PDF 文件，并执行 Python 代码进行数据分析。
OpenAI 对 Deep Research 进行了严格的安全测试和风险评估，整体风险评估为中等。
模型使用新浏览数据集进行训练，学习核心的浏览能力和数据分析技能。
外部红队测试评估了 Deep Research 的关键风险，包括个人信息和隐私、生成不允许内容等。
评估方法适应了 Deep Research 的能力，使用标准的安全评测和不允许内容评测。
风险识别和缓解措施包括禁止模型随意拼接 URL、黑名单、输出过滤器等。
Deep Research 在隐私保护方面进行了强化，拒绝提供敏感信息。
模型的运行代码能力在沙箱环境中执行，无法直接访问互联网。
偏见和幻觉风险通过训练后微调进行缓解，模型的准确率显著高于之前的版本。
Deep Research 在 Preparedness 框架评测中被归类为中等风险，持续监测和风险识别是必要的。
模型在网络安全和生物威胁生成方面的能力被评估为中等风险，需加强安全保障。
Deep Research 在说服和模型自主性方面的评测显示出中等风险，尚未达到高风险水平。
整体而言，Deep Research 是一个强大的工具，旨在帮助用户应对复杂的研究任务。

🔎

延伸解读

Deep Research 的多功能性

Deep Research 具备强大的多步骤研究能力，能够处理文本、图像和 PDF 文件，并执行 Python 代码进行数据分析。这种多功能性使其在学术研究、数据分析和信息整合等领域具有广泛应用潜力，尤其适合需要综合多种信息源的复杂任务。

安全性与隐私保护

OpenAI 对 Deep Research 进行了严格的安全测试，评估其在隐私保护和抵御恶意指令方面的能力。尽管整体风险评估为中等，但用户在使用时仍需关注模型可能产生的隐私泄露风险，尤其是在处理敏感信息时。

风险评估与持续改进

Deep Research 在风险评估中被归类为中等风险，表明其在网络安全和生物威胁生成方面存在一定的潜在风险。OpenAI 计划持续监测和改进模型的安全性，以应对未来可能出现的新风险，用户在使用时应保持警惕。

❓

延伸问答

Deep Research 是什么？

Deep Research 是一种新型智能体，能够在互联网上执行复杂的多步骤研究任务。

Deep Research 如何进行数据分析？

Deep Research 能够搜索、解读和分析文本、图像及 PDF 文件，并执行 Python 代码进行数据分析。

OpenAI 对 Deep Research 进行了哪些安全测试？

OpenAI 对 Deep Research 进行了严格的安全测试和风险评估，确保隐私保护并抵御恶意指令。

Deep Research 的风险评估结果如何？

Deep Research 在 Preparedness 框架评测中被归类为中等风险，需持续监测和风险识别。

Deep Research 如何处理隐私保护问题？

Deep Research 强化了隐私保护，拒绝提供敏感信息，并监测用户滥用行为。

Deep Research 在偏见和幻觉风险方面的表现如何？

Deep Research 通过训练后微调来缓解偏见和幻觉风险，模型的准确率显著高于之前的版本。

🏷️