机器之心 ·

WHALE来了，南大周志华团队做出更强泛化的世界模型

💡 原文中文，约6000字，阅读约需15分钟。

📝

内容提要

研究者提出了WHALE框架，用于学习可泛化的世界模型，以增强决策能力。该框架结合行为条件和回溯滚动技术，解决了泛化和不确定性估计的挑战。实验结果表明，WHALE在模拟和现实任务中表现优异，展现出强大的泛化能力和扩展性。

🎯

🔎

WHALE框架通过结合行为条件和回溯滚动技术，显著提升了世界模型的泛化能力和不确定性估计。这一创新不仅为具身智能体的决策提供了更可靠的支持，也为未来的人工智能研究开辟了新的方向，尤其是在复杂环境中的应用潜力。

实验表明，Whale-ST和Whale-X在模拟和现实任务中均表现优异，尤其是在视频生成质量和价值估计准确率方面。这意味着在实际应用中，这些模型能够更有效地处理复杂的决策任务，降低探索成本，提升决策效率。

不确定性估计在世界模型中至关重要，能够防止错误预测对决策的负面影响。WHALE框架中的retracing-rollout方法在这一方面表现出色，显著提高了模型的稳定性和可靠性，为离线策略优化提供了更坚实的基础。

❓

WHALE框架旨在学习可泛化的世界模型，以增强决策能力。

WHALE框架结合了行为条件和回溯滚动技术，来增强泛化能力和进行有效的不确定性估计。

Whale-ST是基于时空transformer的可扩展世界模型，而Whale-X是一个在970K机器人演示上预训练的414M参数世界模型。

实验结果表明，WHALE框架在模拟和现实任务中表现优异，展现出强大的泛化能力和扩展性。

retracing-rollout方法在不确定性估计方面优于其他基准方法，显著提高了模型的稳定性。

Whale-X展现出强大的扩展性，增加模型参数或预训练数据均能提升性能。

🏷️