量子位 ·

世界模型和具身大脑最新突破：90%生成数据，VLA性能暴涨300%｜开源

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

国产公司极佳视界发布GigaWorld-0模型，成功将VLA模型训练中生成数据比例提升至90%，性能提升近300%。该模型通过生成高保真、多样化的具身交互数据，解决了真实数据稀缺问题，推动具身智能发展。

🎯

🔎

GigaWorld-0模型通过将生成数据比例提升至90%，有效解决了真实数据稀缺的问题。这一创新不仅降低了数据采集成本，还提高了模型的泛化能力。然而，生成数据的质量和多样性仍需持续关注，以确保其在实际应用中的有效性。

GigaWorld-0-Video和GigaWorld-0-3D的结合，展示了在生成与重建技术上的突破。特别是稀疏注意力机制和MoE架构的应用，显著提升了生成效率与多样性。这些技术创新为未来的具身智能应用提供了强有力的支持。

极佳视界作为国内首家专注于世界模型的公司，其GigaWorld-0在市场上展现出强大的竞争力。与其他先进模型相比，尽管参数较少，但在性能上却显著领先，表明其在具身智能领域的潜力和应用价值。

❓

GigaWorld-0模型成功将VLA模型训练中生成数据比例提升至90%，并实现近300%的性能提升。

GigaWorld-0通过生成高保真、多样化的具身交互数据，突破了真实数据不足的限制。

GigaWorld-0由GigaWorld-0-Video和GigaWorld-0-3D两大组件构成。

GigaWorld-0-Video采用了稀疏注意力机制和MoE架构，提升了生成效率与多样性。

GigaWorld-0是首个采用FP8精度端到端训练的世界模型。

极佳视界成立于2023年，专注于世界模型与具身智能的技术创新，核心团队由多所知名院校的顶尖研究人员组成。

🏷️