量子位 ·

Sora2还在5秒打转，字节AI生视频已经4分钟“起飞”

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

字节推出Self-Forcing++方法，成功实现最长4分15秒的高质量AI视频生成，解决了传统模型生成短视频的问题。该方法通过优化训练过程，显著提升视频的稳定性和一致性，标志着AI视频生成技术的进步。

🎯

关键要点

字节推出Self-Forcing++方法，实现最长4分15秒的高质量AI视频生成。
该方法优化训练过程，显著提升视频的稳定性和一致性。
传统模型生成视频长度有限，通常只有5到10秒，后期画质容易崩坏。
Self-Forcing++通过教师知识和自生成视频片段指导自回归生成，解决了长视频生成的问题。
优化训练过程包括反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练。
引入组相对策略优化（GRPO）改善视频平滑性，减少画面突变异常。
使用Gemini-2.5-Pro作为评估工具，提供更精准的视觉稳定性评分。
在短时长视频质量上，Self-Forcing++表现优于多种基准模型。
在长时长生成中，Self-Forcing++在视觉稳定性和动态程度上均有显著提升。
最终实验验证，Self-Forcing++在保真度和一致性上优于基线方法。

🏷️

继续阅读

AI客服越智能越坑人？坑了商家、坑客户，咋办？
你是否也在烦恼AI客服只会兜圈子、不给退款、死活不转人工？这期内容拆解AI客服常见套路，教你识别“只会聊天不办事”的系统，并学会更高效地和AI客服沟通。 ...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
商业智能分析：AI时代的完整指南
数据智能是现代商业智能的基础，通过学习数据结构和实时反馈提升分析能力。结合复合AI，数据智能高效处理分析工作流，帮助各业务部门快速获取洞察，显著提高企业决...
宣布AI网关工作组
AI网关工作组将在阿姆斯特丹的KubeCon + CloudNativeCon欧洲大会上展示其提案，探讨AI与网络基础设施的交集，并展示初步设计和原型。
[龙虾教程] 自建Sub2API中转站管理多个AI账号方便集中管理/好友共享/快速切换
自建API中转站可集中管理多个账号，如ChatGPT和Claude，简化调度和使用。使用Sub2API程序可实现账号批量管理、自动切换和共享，建议在内网部...
上下文衰退如何影响企业AI和大型语言模型（LLM）的结果，以及如何解决这一问题
上下文衰退影响企业AI和大型语言模型（LLM）的表现。旧数据未被清除，导致信息混乱和推理能力下降。企业需监控关键数据指标，清除过时数据，以提升AI的准确性和效率。

Sora2还在5秒打转，字节AI生视频已经4分钟“起飞”

内容提要

关键要点

标签

继续阅读