小红花·文摘

蒙特卡洛树扩散（MCTD）结合了蒙特卡洛树搜索与扩散模型，有效解决了扩散模型在长程推理中的可扩展性问题。在迷宫导航等任务中，MCTD的成功率接近100%。为提高效率，研究团队推出了快速MCTD，使推理速度提升100倍，显著降低计算开销。

图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

量子位 ·

本研究提出了一种新方法——蒙特卡洛束搜索（MCBS），结合了束搜索、蒙特卡洛回路和TD3，有效解决了传统方法的探索不足问题。实验结果显示，MCBS在多个基准测试中优于传统TD3。

连续控制中演员-评论家强化学习的蒙特卡洛束搜索

BriefGPT - AI 论文速递 ·

本研究提出了一种基于计算树逻辑的自然语言解释框架，旨在提升人工智能在顺序规划中的信任度。该框架有效地解释了蒙特卡洛树搜索算法，确保用户查询与环境动态的一致性，表现优异。

将大语言模型与基于逻辑的框架结合以解释蒙特卡洛树搜索

BriefGPT - AI 论文速递 ·

本研究提出了一种基于蒙特卡洛概率推理的学习控制方法（MC-PILCO），旨在提升复杂机器人任务的控制效率。研究表明，MC-PILCO在物理系统中优于传统方法，有效解决了控制欠驱动系统的问题。

Model-Based Reinforcement Learning for Global Control in Underactuated Systems

BriefGPT - AI 论文速递 ·

本文提出了一种基于整洁评分的蒙特卡洛树搜索框架，利用RGB-D摄像头解决桌面整理问题。通过构建数据集和训练鉴别器，该方法能够在未知配置中评估整洁度并探索不同的整理路径，验证了其有效性。

整洁评分指导的蒙特卡洛树搜索用于视觉桌面整理

BriefGPT - AI 论文速递 ·

Bengio参与，扩散模型+蒙特卡洛树搜索实现System 2规划

机器之心 ·

本研究解决了现有基于大型语言模型（LLM）的自主机器学习代理在代码生成时存在的低多样性和次优质量问题。我们提出了一种新的自省蒙特卡洛树搜索方法（I-MCTS），通过分析父节点和兄弟节点的解决方案来不断优化搜索树中的节点，从而提高决策过程的整体质量。实验证明，该方法在各种机器学习任务中相较于其他开源AutoML代理表现出6%的绝对性能提升。

I-MCTS：通过自省蒙特卡洛树搜索提升自主AutoML

BriefGPT - AI 论文速递 ·

基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

DEV Community ·

敏捷预测：利用蒙特卡洛模拟和流量指标提升可预测性

DEV Community ·

本研究提出了蒙特卡洛树扩散(MCTD)框架，结合扩散模型与蒙特卡洛树搜索，解决了传统扩散模型的可扩展性问题。实验结果表明，MCTD在长期任务中优于现有基线，并在计算量增加时提供更高质量的解决方案。

蒙特卡洛树扩散用于系统2规划

BriefGPT - AI 论文速递 ·

智能蒙特卡洛方法将AI语言模型计算成本降低40%

DEV Community ·

通过扭曲序列蒙特卡洛实现数学问题的逐步推理

Apple Machine Learning Research ·

该研究针对知识库问答（KBQA）中的弱KB意识、效率与效果的不平衡以及对标注数据的高依赖性等挑战，提出了一种新的方法KBQA-o1。通过引入基于ReAct的代理过程和蒙特卡洛树搜索（MCTS），该方法能够在探索KB环境的同时，逐步生成逻辑形式，并显著提高了在低标注数据条件下的表现，提升了Llama-3.1-8B模型在GrailQA上的F1得分至78.5%。

KBQA-o1：结合蒙特卡洛树搜索的主动知识库问答

BriefGPT - AI 论文速递 ·

本研究解决了在目标导向对话中有效识别和获取缺失信息的挑战。通过结合大语言模型生成最大化信息增益的问题、蒙特卡洛树搜索构建决策树，以及层级反馈机制的创新方法，提出了一种自适应问题提问的方法。实验结果显示，该方法在成功率上平均提高了12%，并且在对话过程中减少了10倍的语言模型调用次数，显著提升了信息获取的效率。

反馈意识蒙特卡洛树搜索方法在目标导向对话中的信息获取效率

BriefGPT - AI 论文速递 ·

本研究解决了大语言模型（LLM）在战略规划能力方面的不足，提出了一种新框架——MASTER，通过协调智能体的招募和沟通来增强LLM的蒙特卡洛树搜索（MCTS）能力。实验结果表明，该框架在多任务上表现出色，HotpotQA的准确率达到76%，WebShop达到80%，在这些数据集上创造了新的最先进性能。