内容提要
Deep Research 是一种新型智能体,能够在互联网上执行复杂的多步骤研究任务。它通过搜索和分析文本、图像及 PDF 文件进行推理,并能执行 Python 代码进行数据分析。OpenAI 对其进行了严格的安全测试和风险评估,确保隐私保护并抵御恶意指令,整体风险评估为中等,未来将继续改进安全措施。
关键要点
-
Deep Research 是一种新型智能体,能够在互联网上执行复杂的多步骤研究任务。
-
该模型基于早期版本的 OpenAI o3,专门针对网页浏览进行了优化。
-
Deep Research 能够搜索、解读和分析文本、图像及 PDF 文件,并执行 Python 代码进行数据分析。
-
OpenAI 对 Deep Research 进行了严格的安全测试和风险评估,整体风险评估为中等。
-
模型使用新浏览数据集进行训练,学习核心的浏览能力和数据分析技能。
-
外部红队测试评估了 Deep Research 的关键风险,包括个人信息和隐私、生成不允许内容等。
-
评估方法适应了 Deep Research 的能力,使用标准的安全评测和不允许内容评测。
-
风险识别和缓解措施包括禁止模型随意拼接 URL、黑名单、输出过滤器等。
-
Deep Research 在隐私保护方面进行了强化,拒绝提供敏感信息。
-
模型的运行代码能力在沙箱环境中执行,无法直接访问互联网。
-
偏见和幻觉风险通过训练后微调进行缓解,模型的准确率显著高于之前的版本。
-
Deep Research 在 Preparedness 框架评测中被归类为中等风险,持续监测和风险识别是必要的。
-
模型在网络安全和生物威胁生成方面的能力被评估为中等风险,需加强安全保障。
-
Deep Research 在说服和模型自主性方面的评测显示出中等风险,尚未达到高风险水平。
-
整体而言,Deep Research 是一个强大的工具,旨在帮助用户应对复杂的研究任务。
延伸问答
Deep Research 是什么?
Deep Research 是一种新型智能体,能够在互联网上执行复杂的多步骤研究任务。
Deep Research 如何进行数据分析?
Deep Research 能够搜索、解读和分析文本、图像及 PDF 文件,并执行 Python 代码进行数据分析。
OpenAI 对 Deep Research 进行了哪些安全测试?
OpenAI 对 Deep Research 进行了严格的安全测试和风险评估,确保隐私保护并抵御恶意指令。
Deep Research 的风险评估结果如何?
Deep Research 在 Preparedness 框架评测中被归类为中等风险,需持续监测和风险识别。
Deep Research 如何处理隐私保护问题?
Deep Research 强化了隐私保护,拒绝提供敏感信息,并监测用户滥用行为。
Deep Research 在偏见和幻觉风险方面的表现如何?
Deep Research 通过训练后微调来缓解偏见和幻觉风险,模型的准确率显著高于之前的版本。