NVIDIA Blog ·

NVIDIA发布开放物理人工智能数据集，推动机器人和自动驾驶汽车的发展

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

NVIDIA发布了全球最大的开放合成数据集，包含15TB数据和320,000条轨迹，支持机器人和自动驾驶汽车的开发。该数据集可用于模型预训练和微调，推动安全、准确的商业级模型发展。

🎯

🔎

NVIDIA发布的物理人工智能数据集涵盖了多种交通场景和环境，能够为机器人和自动驾驶汽车的开发提供丰富的数据支持。这种多样性不仅有助于提高模型的安全性和准确性，还能推动在医疗、家庭助理等领域的应用，促进物理AI的广泛发展。

尽管NVIDIA的数据集为开发者提供了宝贵的资源，但在使用过程中仍需注意数据处理的效率和模型训练的复杂性。开发者可以利用NVIDIA NeMo Curator等工具来优化数据处理，但仍需投入时间和精力进行模型的微调和验证，以确保最终产品的可靠性。

该数据集的发布将为安全性研究提供新的机遇，尤其是在自动驾驶汽车的安全评估方面。研究人员可以利用多样化的场景数据来识别潜在的风险和异常情况，从而提升自动驾驶系统的安全性和应对复杂环境的能力。

❓

该数据集包含15TB数据和320,000条轨迹。

数据集可用于模型预训练、测试和微调，帮助开发更安全、准确的机器人和自动驾驶汽车模型。

该数据集是开放的，包含多种交通场景的视频片段，覆盖美国和欧洲多个城市，旨在促进物理AI的研究。

开发者可以利用NVIDIA NeMo Curator等工具高效处理数据集，以进行模型训练和定制。

加州大学伯克利分校、卡内基梅隆大学和加州大学圣地亚哥分校的研究团队计划利用该数据集进行AI开发。

数据集的多样性和规模将帮助识别异常情况和评估模型的泛化性能，促进安全AI研究。

🏷️