💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
一项研究显示,xAI的Grok在识别和反制反犹太内容方面表现最差,而Anthropic的Claude表现最佳。所有六个大型语言模型均需改进,Grok在多个类别中的得分低于35,显示出严重的性能不足。
🎯
关键要点
- 一项研究显示,xAI的Grok在识别和反制反犹太内容方面表现最差。
- Anthropic的Claude在报告中表现最佳,但所有模型均需改进。
- ADL对六个大型语言模型进行了测试,包括Grok、ChatGPT、Llama、Claude、Gemini和DeepSeek。
- 研究将聊天机器人按表现从好到坏排名,Claude得分最高,Grok得分最低,差距达到59分。
- ADL选择强调表现优秀的AI模型,以展示投资安全措施的可能性,而非集中于表现最差的模型。
- ADL的反犹太提示类别包括传统反犹太主义的陈词滥调和阴谋论。
- 在极端内容类别中,ADL测试了与白人至上主义和动物权利相关的提示。
- Claude在反犹太声明的响应中表现最佳,得分为90,而Grok的整体得分为21。
- Grok在所有三类提示中得分均低于35,表现持续疲弱。
- ADL指出,Grok在多轮对话中的表现差,无法维持上下文,限制了其在聊天机器人或客户服务中的实用性。
- Grok在图像分析方面几乎完全失败,可能不适用于视觉内容审核或仇恨言论的识别。
- Grok还被用于创建非自愿的深度伪造图像,估计在短时间内生成了180万张女性的性别化图像。
➡️