合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

机器之心 ·

合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

上海人工智能实验室开源了生成式世界模型AETHER，该模型基于合成数据训练，具备3D空间决策与规划能力。它结合几何重建与生成建模，提升了动态环境中的智能决策能力，支持目标导向视觉规划、4D动态重建和动作条件视频预测，展现出强大的零样本泛化能力。

🎯

关键要点

上海人工智能实验室开源了生成式世界模型AETHER，基于合成数据训练。
AETHER具备3D空间决策与规划能力，支持目标导向视觉规划、4D动态重建和动作条件视频预测。
研究团队将几何重建与生成式建模深度融合，提出了'重建—预测—规划'一体化框架。
传统世界模型忽略几何信息，AETHER通过空间建模显著提升了模型的推理准确性与一致性。
AETHER利用海量仿真RGBD数据，开发了完整的数据清洗与动态重建流程。
模型通过三项关键技术提升具身智能系统在动态环境中的感知、建模与决策能力。
目标导向视觉规划能够自动生成合理路径，确保行动路线安全且符合物理规律。
4D动态重建可实现零样本迁移，精确捕捉时空环境的动态变化。
动作条件视频预测通过相机轨迹预测未来场景变化，增强具身智能系统的预测能力。
AETHER展现出强大的零样本泛化能力，能够在虚拟数据上训练并应用于真实世界。
AETHER设计了统一的多任务框架，实现动态重建、视频预测和动作规划的协同优化。
实验结果显示AETHER在动态场景重建方面达到或超过现有SOTA水平，促进了多任务框架下的任务准确度提升。

🏷️

继续阅读

ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用
本文提出了一种改进的对抗扩散压缩方法（AdcVSR），用于真实世界视频超分辨率。该方法通过剪枝和轻量级一维卷积，显著降低模型参数和推理时间，同时保持视频质...
[使用指南] OpenClaw AI机器人现已支持原生备份命令可完整备份所有数据
#人工智能 OpenClaw 最新版已经原生提供备份命令，可以完整备份所有数据并进行备份校验，确保用户重装 / 迁移 / 故障恢复时可以直接使用备份数据。...
首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖
浙江推出首个物理AI数据基座平台“无垠”，旨在解决机器人数据短缺问题。该平台结合真实数据与虚拟仿真，提供高质量数据，支持具身智能的训练与应用，推动行业发展。
物理信息机器学习新突破！新型GNN架构可对复杂多体动力系统进行准确预测，赋能机器人/航空航天/材料科学
瑞士洛桑联邦理工学院提出的DYNAMI-CAL GraphNet结合物理规律与图神经网络，显著提高了多体动力系统的建模精度和稳定性，适用于机器人和航空航天等领域。
提高人工智能模型解释其预测能力
麻省理工学院研究人员开发了一种新方法，利用深度学习模型提取概念，以提高计算机视觉模型的准确性和可解释性。该方法通过限制使用的概念数量，确保选择最相关的概念...
A New Era of MySQL Community Engagement: Public Community Roadmap Webinar Highlights
Oracle values the MySQL community. MySQL is fundamental to our data strategy....

合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

内容提要

关键要点

标签

继续阅读