量子位 ·

图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

蒙特卡洛树扩散（MCTD）结合了蒙特卡洛树搜索与扩散模型，有效解决了扩散模型在长程推理中的可扩展性问题。在迷宫导航等任务中，MCTD的成功率接近100%。为提高效率，研究团队推出了快速MCTD，使推理速度提升100倍，显著降低计算开销。

🎯

🔎

蒙特卡洛树扩散（MCTD）将传统的蒙特卡洛树搜索与现代扩散模型相结合，成功解决了扩散模型在长程推理中的可扩展性问题。这种创新的结合不仅提高了模型的成功率，还在复杂决策任务中实现了探索与利用的平衡，展示了其在迷宫导航等任务中的优越性能。

快速蒙特卡洛树扩散（Fast-MCTD）通过并行处理和轨迹粗化技术，显著提升了推理速度，达到原有MCTD的100倍。这一进步使得Fast-MCTD在处理长序列生成时更加高效，降低了计算开销，成为更实用的解决方案，尤其在迷宫导航和机械臂操作等任务中表现突出。

尽管MCTD和Fast-MCTD在推理速度和成功率上取得了显著提升，但计算成本仍然较高。尤其在大规模搜索空间中，评估多个轨迹假设的开销依然是一个挑战。因此，未来的研究需要关注如何进一步优化计算效率，以提升模型的实用性和可扩展性。

❓

MCTD是将蒙特卡洛树搜索与扩散模型结合的一种新方法，旨在解决扩散模型在长程推理中的可扩展性问题。

MCTD在迷宫导航任务中成功率接近100%，显著优于其他模型。

Fast-MCTD的推理速度提升了100倍，并通过并行处理和轨迹粗化技术显著降低了计算开销。

MCTD通过将轨迹划分为多个子规划，结合MCTS的探索能力与扩散模型的利用能力，实现了探索与利用的平衡。

尽管MCTD在推理可扩展性上有所提升，但其计算成本仍然较高，尤其在大规模搜索空间中效率较低。

Fast-MCTD通过引入并行处理和轨迹粗化技术，减少了每次去噪的计算量，从而提高了整体效率。

🏷️