一项研究显示,xAI的Grok在识别和反制反犹太内容方面表现最差,而Anthropic的Claude表现最佳。所有六个大型语言模型均需改进,Grok在多个类别中的得分低于35,显示出严重的性能不足。
完成下面两步后,将自动完成登录并继续当前操作。