小红花·文摘

本研究针对柔性作业车间调度问题（FJSSP），提出了一种基于广义嵌套回滚策略的新算法。该算法在性能上优于其他蒙特卡罗树搜索方法，但在大规模实例中的完成时间仍低于已知上界。

自适应偏差广义回滚策略适应在柔性作业车间调度问题中的应用

BriefGPT - AI 论文速递 ·

本文探讨了大型推理模型在推理路径优化方面的不足，提出了一种受蒙特卡罗树搜索启发的追溯搜索算法，以提炼高质量推理路径。研究表明，该方法显著减少了推理长度并提升了模型表现，展示了搜索算法在推理模型中的改进潜力。

Retro-Search: Exploring Untaken Paths for Deeper and More Efficient Reasoning

BriefGPT - AI 论文速递 ·

本研究提出了叙事工作室，旨在克服交互式叙事中的线性流程限制。通过结合大型语言模型和蒙特卡罗树搜索，用户可以从故事中的特定点进行分支探索，自动扩展多样的叙事路径，创造更丰富的故事发展。

Narrative Studio: Exploring Visual Narratives Using Large Language Models and Monte Carlo Tree Search

BriefGPT - AI 论文速递 ·

本研究提出了CoNav-Maze模拟环境，旨在解决人机合作导航中的信息不完整问题。通过引入信息增益蒙特卡罗树搜索算法，提升了机器人与人类操作员的沟通效率，降低了认知负荷，同时保持了任务表现。

学习人类感知动态以实现有效的机器人沟通

BriefGPT - AI 论文速递 ·

本研究提出了一种创新的蒙特卡罗树搜索（MCTS）方法，旨在优化作业车间调度问题（JSSP），特别是减少加权作业完成时间。实验结果表明，MCTS在处理大规模JSSP时能有效生成高质量解决方案，优于传统的约束编程方法。

研究蒙特卡罗树搜索方法在作业车间调度问题中的应用

BriefGPT - AI 论文速递 ·

本研究提出COS(M+O)S框架，结合蒙特卡罗树搜索与价值模型，优化开放式情节发展，显著提升3B参数语言模型的情节质量，接近70B模型水平。

COS(M+O)S: Exploring Story Space with Curiosity and Reinforcement Learning Enhanced Monte Carlo Tree Search through Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种集成加速测试与评估方法（ITEM），旨在提升自动驾驶系统测试中的信息利用效率。通过蒙特卡罗树搜索和双重代理测试框架，ITEM提高了危害领域识别的准确性，实验结果表明其在安全评估中具有广泛的应用潜力。

充分利用测试信息：一种集成加速测试与评估方法用于自动驾驶系统

BriefGPT - AI 论文速递 ·

本文研究多智能体路径规划（MAPF）问题，提出了多种优化算法和解决方案，包括基于图嵌入的MAPF算法、分布式蒙特卡罗树搜索方法以及处理通信约束的精确算法。研究表明，这些方法在效率和性能上优于现有技术，尤其在特定网络结构下表现突出。

解决高度集中的网络中的多代理路径规划问题

BriefGPT - AI 论文速递 ·

本研究提出了一种基于蒙特卡罗树搜索和图神经网络的量子电路qubit路由优化方法，显著提高了量子电路的执行效率。通过强化学习和深度学习技术，优化了量子电路设计，降低了T门计数，提升了变分量子算法在噪声环境下的性能。

AlphaRouter: 基于强化学习和树搜索的量子电路路由

BriefGPT - AI 论文速递 ·

本研究提出了一种基于深度强化学习的语法强化学习（GRL）算法，旨在高效计数图中的路径和环。该算法结合了蒙特卡罗树搜索和变换器架构，发现了新型矩阵计数公式，计算效率提高了2到6倍，具有重要的潜在影响。

Research on Path and Cycle Counting Formulas in Graphs Based on Deep Reinforcement Learning

BriefGPT - AI 论文速递 ·

本文介绍了一种基于RGB相机的多对象重新排列规划方法，结合蒙特卡罗树搜索和深度神经网络进行状态估计。该方法在UR-5机械臂上成功验证，解决了多个实例，并探讨了运动学逆解模型、碰撞预测和任务驱动的图像压缩等技术，展示了机器人在复杂场景中的高效运动规划能力。

基于流的视觉逆向运动学求解器及其融合碰撞检测

BriefGPT - AI 论文速递 ·

本文探讨了基于模型的强化学习技术，结合蒙特卡罗树搜索（MCTS）与深度学习，提出多种算法以提升决策效率和收敛速度。研究表明，新的混合策略在非马尔可夫决策过程和有限时间决策中表现优越，尤其在离线到在线微调中，贝叶斯设计原则有效避免性能下降，提升学习效果。

通过引导搜索增强强化学习

BriefGPT - AI 论文速递 ·

本文探讨了多种基于蒙特卡罗树搜索（MCTS）算法的改进方法，包括动态抽样树策略、结合深度强化学习的搜索算法以及连续状态和动作空间的扩展。这些方法在不同领域的实验中表现优越，显著提升了搜索效率和优化效果。

蒙特卡罗树搜索中经过状态占用正则化的可证明高效长期探索

BriefGPT - AI 论文速递 ·

本文探讨了蒙特卡罗树搜索（MCTS）在游戏及其他领域的应用，提出结合深度学习和优化算法的新方法，显著提升搜索效果和游戏表现。研究表明，MCTS在高维问题和复杂游戏中表现优越，验证了专家知识与策略原则的有效性。

将组合优化引入 MCTS 方法：应用于棋盘游戏 boop

BriefGPT - AI 论文速递 ·

本文提出了一种基于深度学习的图卷积网络方法，解决NP困难问题，评估结果显示其性能优于现有启发式算法。同时，结合图神经网络与蒙特卡罗树搜索的技术，能够高效计算Steiner树，并在系统推断中展示了新模型的优势。

使用图神经网络解决树包含问题

BriefGPT - AI 论文速递 ·

本文探讨了蒙特卡罗树搜索（MCTS）在优化和强化学习中的应用，提出了多种改进算法以提高收敛速率和探索能力。研究表明，这些新方法在复杂问题上表现优越，显著提升了计算效率和解的质量。

蒙特卡洛搜索算法探索蒙特卡洛树搜索探索术语

BriefGPT - AI 论文速递 ·

OpenAI泄露了名为Q*的人工智能突破，它在小学数学方面表现出色。Q*是Q-learning和A*的组合。DeepMind正在研究与AlphaGo类似的蒙特卡罗树搜索。这些突破可能对规划和代理行为有重要影响。OpenAI的突破性Q*可能是解决数学问题的一种方法。虽然数学成绩只相当于小学生水平，但研究人员对Q*的未来成功非常乐观。