机器之心 ·

黄仁勋圈重点的世界模型平台是个啥？技术报告全解析，华人贡献中坚力量

💡 原文中文，约6700字，阅读约需16分钟。

📝

内容提要

英伟达在CES发布了名为「Cosmos」的平台，旨在通过生成合成数据解决物理AI的数据不足问题。Cosmos包含8个开源模型，支持视频生成，已被多家机器人和汽车公司采用，推动机器人和自动驾驶技术的发展。

🎯

🔎

英伟达的Cosmos平台标志着物理AI领域的重要进展。通过生成合成数据，Cosmos不仅解决了数据不足的问题，还为机器人和自动驾驶技术的普及奠定了基础。随着越来越多的公司采用这一平台，物理AI的应用场景将不断扩展，开发者需要关注如何利用这些工具提升自身项目的竞争力。

在Cosmos项目的核心贡献者名单中，华人学者占据了重要位置。这不仅反映了他们在全球AI研究中的影响力，也显示了多元化团队在技术创新中的重要性。对于希望在AI领域发展的研究者而言，参与类似项目将是一个提升自身能力和影响力的良机。

Cosmos平台的模型采用了扩散模型和自回归模型两种架构，展现了良好的可扩展性。这种设计使得开发者可以根据不同的需求进行微调，适应多种物理AI应用。理解这些模型的工作原理和适用场景，将帮助开发者更有效地利用Cosmos平台进行创新。

❓

Cosmos平台旨在通过生成合成数据解决物理AI的数据不足问题，支持视频生成，并包含8个开源模型。

Cosmos平台的模型参数量从4B到14B不等。

Cosmos平台的模型在2000万小时的视频数据上进行训练，分为扩散模型和自回归模型。

Cosmos平台的目标是让物理AI普及化，使每个开发者都能使用通用机器人技术。

Cosmos Tokenizer是一组视觉tokenizer，用于将原始视觉数据转换为紧凑的语义token，以提高训练效率。

华人学者在Cosmos项目中承担了大量工作，贡献者名单中有许多知名华人研究者。

🏷️