本研究针对柔性作业车间调度问题(FJSSP),提出了一种基于广义嵌套回滚策略的新算法。该算法在性能上优于其他蒙特卡罗树搜索方法,但在大规模实例中的完成时间仍低于已知上界。
本文探讨了大型推理模型在推理路径优化方面的不足,提出了一种受蒙特卡罗树搜索启发的追溯搜索算法,以提炼高质量推理路径。研究表明,该方法显著减少了推理长度并提升了模型表现,展示了搜索算法在推理模型中的改进潜力。
本研究提出了叙事工作室,旨在克服交互式叙事中的线性流程限制。通过结合大型语言模型和蒙特卡罗树搜索,用户可以从故事中的特定点进行分支探索,自动扩展多样的叙事路径,创造更丰富的故事发展。
本研究提出了CoNav-Maze模拟环境,旨在解决人机合作导航中的信息不完整问题。通过引入信息增益蒙特卡罗树搜索算法,提升了机器人与人类操作员的沟通效率,降低了认知负荷,同时保持了任务表现。
本研究提出了一种创新的蒙特卡罗树搜索(MCTS)方法,旨在优化作业车间调度问题(JSSP),特别是减少加权作业完成时间。实验结果表明,MCTS在处理大规模JSSP时能有效生成高质量解决方案,优于传统的约束编程方法。
本研究提出COS(M+O)S框架,结合蒙特卡罗树搜索与价值模型,优化开放式情节发展,显著提升3B参数语言模型的情节质量,接近70B模型水平。
本研究提出了一种集成加速测试与评估方法(ITEM),旨在提升自动驾驶系统测试中的信息利用效率。通过蒙特卡罗树搜索和双重代理测试框架,ITEM提高了危害领域识别的准确性,实验结果表明其在安全评估中具有广泛的应用潜力。
本文研究多智能体路径规划(MAPF)问题,提出了多种优化算法和解决方案,包括基于图嵌入的MAPF算法、分布式蒙特卡罗树搜索方法以及处理通信约束的精确算法。研究表明,这些方法在效率和性能上优于现有技术,尤其在特定网络结构下表现突出。
本研究提出了一种基于蒙特卡罗树搜索和图神经网络的量子电路qubit路由优化方法,显著提高了量子电路的执行效率。通过强化学习和深度学习技术,优化了量子电路设计,降低了T门计数,提升了变分量子算法在噪声环境下的性能。
本研究提出了一种基于深度强化学习的语法强化学习(GRL)算法,旨在高效计数图中的路径和环。该算法结合了蒙特卡罗树搜索和变换器架构,发现了新型矩阵计数公式,计算效率提高了2到6倍,具有重要的潜在影响。
本文介绍了一种基于RGB相机的多对象重新排列规划方法,结合蒙特卡罗树搜索和深度神经网络进行状态估计。该方法在UR-5机械臂上成功验证,解决了多个实例,并探讨了运动学逆解模型、碰撞预测和任务驱动的图像压缩等技术,展示了机器人在复杂场景中的高效运动规划能力。
本文探讨了基于模型的强化学习技术,结合蒙特卡罗树搜索(MCTS)与深度学习,提出多种算法以提升决策效率和收敛速度。研究表明,新的混合策略在非马尔可夫决策过程和有限时间决策中表现优越,尤其在离线到在线微调中,贝叶斯设计原则有效避免性能下降,提升学习效果。
本文探讨了多种基于蒙特卡罗树搜索(MCTS)算法的改进方法,包括动态抽样树策略、结合深度强化学习的搜索算法以及连续状态和动作空间的扩展。这些方法在不同领域的实验中表现优越,显著提升了搜索效率和优化效果。
本文探讨了蒙特卡罗树搜索(MCTS)在游戏及其他领域的应用,提出结合深度学习和优化算法的新方法,显著提升搜索效果和游戏表现。研究表明,MCTS在高维问题和复杂游戏中表现优越,验证了专家知识与策略原则的有效性。
本文提出了一种基于深度学习的图卷积网络方法,解决NP困难问题,评估结果显示其性能优于现有启发式算法。同时,结合图神经网络与蒙特卡罗树搜索的技术,能够高效计算Steiner树,并在系统推断中展示了新模型的优势。
本文探讨了蒙特卡罗树搜索(MCTS)在优化和强化学习中的应用,提出了多种改进算法以提高收敛速率和探索能力。研究表明,这些新方法在复杂问题上表现优越,显著提升了计算效率和解的质量。
OpenAI泄露了名为Q*的人工智能突破,它在小学数学方面表现出色。Q*是Q-learning和A*的组合。DeepMind正在研究与AlphaGo类似的蒙特卡罗树搜索。这些突破可能对规划和代理行为有重要影响。OpenAI的突破性Q*可能是解决数学问题的一种方法。虽然数学成绩只相当于小学生水平,但研究人员对Q*的未来成功非常乐观。
完成下面两步后,将自动完成登录并继续当前操作。