开源模型Reflection被指控造假,CEO发文道歉但未承认,称正在调查。第三方测试无法复现超越其他模型的宣称。模型被质疑套壳Claude,相关证据表明输出一致且过滤“Claude”一词。模型供应商回应称未套壳,正在整理证据。托管平台CTO讲述了与Reflection合作的细节。测试成绩问题反映了测试基准的不足。英伟达科学家表示只相信独立第三方测评。
完成下面两步后,将自动完成登录并继续当前操作。