量子位 ·

AGI-Eval团队：AI视频生成模型年度横评，Sora大饼落地，但国产模型仍然领先！

💡 原文中文，约5900字，阅读约需14分钟。

📝

内容提要

AGI-Eval团队评测AI视频生成模型，Sora在视频-文本一致性和视频质量上略逊于国内领先模型，但运动质量表现较好。整体来看，国产模型在动态场景和细节表现上仍占优势。

🎯

🔎

在AGI-Eval的评测中，国产视频生成模型在动态场景和细节表现上仍然占据优势。这表明国内技术在处理复杂场景时的成熟度和稳定性，可能为未来的应用提供更可靠的支持。

尽管Sora在运动质量上表现良好，但在视频-文本一致性方面存在明显不足，尤其是文本理解错误和指令遵循不符的问题。这可能影响用户体验，尤其是在需要精确表达的应用场景中。

AGI-Eval采用了人工主观评测、模型打分和众包评测相结合的方式，确保评测结果的准确性。这种多维度的评测方法为模型的真实能力提供了更全面的反馈，值得其他领域借鉴。

❓

Sora在视频-文本一致性和视频质量上略逊于国内领先模型。

Sora在运动质量表现略好于可灵1.6，但整体上仍不及国产模型。

评测采用人工主观评测、模型打分和众包评测三种方式，确保结果准确性。

Sora存在文本理解错误和指令遵循不符的问题，生成内容与提示词描述不符。

可灵1.6模型在文本响应度、画面美感及运动合理性上有明显提升，整体效果提升195%。

AGI-Eval平台旨在打造公正、可信、科学的评测生态，推动人机协作评测模式的发展。

🏷️