SafetyBench: 用多项选择题评估大型语言模型的安全性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究使用SafetyBench设计了一个综合评估大型语言模型安全性的基准测试工具,测试结果显示GPT-4表现突出,但当前大型语言模型的安全性仍有提升空间。

🎯

关键要点

  • 该研究使用SafetyBench设计了一个综合评估大型语言模型安全性的基准测试工具。
  • 基准测试工具包括11435个不同类别的问题。
  • 评估结果支持中文和英文两种语言。
  • 测试发现GPT-4在安全性方面表现突出。
  • 当前大型语言模型的安全性仍有提升空间。
➡️

继续阅读