SafetyBench: 用多项选择题评估大型语言模型的安全性 原文约100字,阅读约需1分钟。发表于:2023-09-13T00:00:00Z。 以 SafetyBench 为基础,该研究设计了一个综合评估大型语言模型安全性的基准测试工具,包括 11435 个不同类别的问题,并能够提供两种语言(中文和英文)的评估结果,通过测试发现 GPT-4 在安全性方面相较于其他模型表现突出,但当前大型语言模型的安全性仍有提升空间。 该研究使用SafetyBench设计了一个综合评估大型语言模型安全性的基准测试工具,测试结果显示GPT-4表现突出,但当前大型语言模型的安全性仍有提升空间。 GPT-4 大型语言模型 安全性 提升空间 评估工具 语言模型