Defining and Evaluating Physical Safety for Large Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究开发了无人机物理安全评估基准,发现大型语言模型在实用性与安全性之间存在权衡,较大模型在拒绝危险指令方面表现更佳。

🎯

关键要点

  • 本研究开发了无人机物理安全评估基准。

  • 研究解决了大型语言模型在控制无人机等机器人系统时的物理安全风险评估缺口。

  • 发现主流大型语言模型在实用性和安全性之间存在不理想的权衡。

  • 较大的模型在拒绝危险指令方面表现更佳。

  • 研究为大型语言模型的物理安全设计和评估提供了重要支持。

➡️

继续阅读