开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

💡 原文中文,约5800字,阅读约需14分钟。
📝

内容提要

Meta的Llama 4因被指控存在开源版本与测试版本不一致及数据作弊而引发争议。Meta否认这些指控,称问题源于快速发布导致的质量不稳定,并计划在未来几天发布稳定版本以验证其真实性。

🎯

关键要点

  • Meta的Llama 4因被指控存在开源版本与测试版本不一致及数据作弊而引发争议。

  • Meta否认作弊指控,称问题源于快速发布导致的质量不稳定。

  • Llama 4的编程效果被质疑,尤其是与其他主流模型的比较。

  • 指控包括开源版本与测试版本不一致,以及将测试数据混入训练数据中。

  • 匿名爆料称Meta内部使用数据作弊进行训练,导致一名员工辞职。

  • Meta AI负责人埃哈迈德表示将发布稳定版本以验证模型的真实性。

  • 外部专家指出Llama 4在基准测试中表现过度优化,缺乏真正的技术进步。

  • Meta计划在未来几天发布稳定版本,并承诺增加算力以加快模型更新。

  • Meta面临的挑战是大模型训练过程缓慢,无法快速修复问题。

  • 未来的模型发布将更加谨慎,以避免类似的作弊指控。

延伸问答

Meta的Llama 4为何被指控作弊?

Llama 4被指控因开源版本与测试版本不一致,以及将测试数据混入训练数据中,导致其评测成绩不可信。

Meta对Llama 4的作弊指控有何回应?

Meta否认作弊指控,称问题源于快速发布导致的质量不稳定,并计划发布稳定版本以验证模型的真实性。

Llama 4的编程效果为何受到质疑?

Llama 4的编程效果被质疑是因为其在实际使用中表现不如其他主流模型,且评测结果与实际能力不符。

Meta计划如何解决Llama 4的问题?

Meta计划在未来几天发布一个稳定版本,并承诺增加算力以加快模型更新,避免类似问题再次发生。

外部专家对Llama 4的看法是什么?

外部专家指出Llama 4在基准测试中表现过度优化,缺乏真正的技术进步,甚至可能不如前一版本Llama 3.3。

Meta在发布Llama 4时缺少哪些重要文档?

Meta在发布Llama 4时没有发布技术论文或白皮书,这引发了外界对其透明度的质疑。

➡️

继续阅读