TechWeb 全站精华 ·

Llama 4大模型跌落神坛：作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

💡 原文中文，约3400字，阅读约需9分钟。

📝

内容提要

Meta公司发布的开源大模型Llama 4遭到质疑，因其性能不佳且被指控刷榜，实际表现远低于预期，开源条件限制多，被批评为“伪开源”，导致Meta信誉受损。

🎯

🔎

Meta的Llama 4被批评为“伪开源”，其开源许可条款设置了多重限制，违背了开源的基本原则。与DeepSeek等真正开源模型相比，Llama 4缺乏透明度和自由使用的条件，这可能导致开发者对其信任度下降。

尽管Meta曾宣称Llama 4的编程能力达到中级工程师水平，但实际测试结果显示其在编程和科学推理方面的表现远低于预期。这种宣传与实际差距可能会影响用户对Meta品牌的信任。

Llama 4被指控在训练过程中混入测试集数据以提升模型表现，这种做法引发了对其真实性能的质疑。即使Meta否认这一指控，用户对模型的信任依然受到影响，可能导致开发者对其未来产品的警惕。

❓

Llama 4因性能不佳、被指控刷榜和开源条件限制多而遭到质疑。

Meta被指控在训练后期将测试集数据混入训练数据，以提升模型在评测榜单上的表现。

Llama 4的开源许可条款设置多重限制，包括商业使用需单独申请授权等。

Llama 4在编程能力上表现不佳，尤其在多语言编码测试中得分低于竞争对手。

Meta的开源策略被批评为背离开源精神，缺乏透明度和对开发者的支持。

Llama 4在开放性和性能上均不及DeepSeek，且开源条件更为严格。

🏷️