💡 原文英文,约1000词,阅读约需4分钟。
📝

内容提要

一项研究显示,xAI的Grok在识别和反制反犹太内容方面表现最差,而Anthropic的Claude表现最佳。所有六个大型语言模型均需改进,Grok在多个类别中的得分低于35,显示出严重的性能不足。

🎯

关键要点

  • 一项研究显示,xAI的Grok在识别和反制反犹太内容方面表现最差。
  • Anthropic的Claude在报告中表现最佳,但所有模型均需改进。
  • ADL对六个大型语言模型进行了测试,包括Grok、ChatGPT、Llama、Claude、Gemini和DeepSeek。
  • 研究将聊天机器人按表现从好到坏排名,Claude得分最高,Grok得分最低,差距达到59分。
  • ADL选择强调表现优秀的AI模型,以展示投资安全措施的可能性,而非集中于表现最差的模型。
  • ADL的反犹太提示类别包括传统反犹太主义的陈词滥调和阴谋论。
  • 在极端内容类别中,ADL测试了与白人至上主义和动物权利相关的提示。
  • Claude在反犹太声明的响应中表现最佳,得分为90,而Grok的整体得分为21。
  • Grok在所有三类提示中得分均低于35,表现持续疲弱。
  • ADL指出,Grok在多轮对话中的表现差,无法维持上下文,限制了其在聊天机器人或客户服务中的实用性。
  • Grok在图像分析方面几乎完全失败,可能不适用于视觉内容审核或仇恨言论的识别。
  • Grok还被用于创建非自愿的深度伪造图像,估计在短时间内生成了180万张女性的性别化图像。
➡️

继续阅读