小红花·文摘 - 小红花技术领袖俱乐部

蒙特卡洛树扩散（MCTD）结合了蒙特卡洛树搜索与扩散模型，有效解决了扩散模型在长程推理中的可扩展性问题。在迷宫导航等任务中，MCTD的成功率接近100%。为提高效率，研究团队推出了快速MCTD，使推理速度提升100倍，显著降低计算开销。

图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

量子位 ·

本研究提出了耦合层次扩散（CHD）框架，旨在提升复杂长任务中的扩散规划效果。通过联合建模高层次目标选择与低层次轨迹生成，CHD在迷宫导航、桌面操作和家庭环境等场景中表现优于传统方法。

CHD: Coupled Hierarchical Diffusion for Long-Horizon Tasks

BriefGPT - AI 论文速递 ·

突破！自然语言强化学习(NLRL)：一个可处理语言反馈的强化学习框架

突破！自然语言强化学习(NLRL)：一个可处理语言反馈的强化学习框架

机器之心 ·