本研究针对柔性作业车间调度问题(FJSSP),提出了一种基于广义嵌套回滚策略的新算法。该算法在性能上优于其他蒙特卡罗树搜索方法,但在大规模实例中的完成时间仍低于已知上界。
本文探讨了大型推理模型在推理路径优化方面的不足,提出了一种受蒙特卡罗树搜索启发的追溯搜索算法,以提炼高质量推理路径。研究表明,该方法显著减少了推理长度并提升了模型表现,展示了搜索算法在推理模型中的改进潜力。
本研究提出了叙事工作室,旨在克服交互式叙事中的线性流程限制。通过结合大型语言模型和蒙特卡罗树搜索,用户可以从故事中的特定点进行分支探索,自动扩展多样的叙事路径,创造更丰富的故事发展。
本研究提出了CoNav-Maze模拟环境,以解决人机合作导航中的信息不完整问题。通过引入信息增益蒙特卡罗树搜索算法,提升了机器人与人类的沟通效率和自主导航能力,降低了沟通需求和认知负荷,同时保持了任务表现。
本研究提出了一种创新的蒙特卡罗树搜索(MCTS)方法,旨在优化作业车间调度问题(JSSP),特别是减少加权作业完成时间。实验结果表明,MCTS在处理大规模JSSP时能有效生成高质量解决方案,优于传统的约束编程方法。
本研究提出COS(M+O)S框架,结合蒙特卡罗树搜索与价值模型,优化开放式情节发展,显著提升3B参数语言模型的情节质量,接近70B模型水平。
本研究提出了一种集成加速测试与评估方法(ITEM),旨在提升自动驾驶系统测试中的信息利用效率。通过蒙特卡罗树搜索和双重代理测试框架,ITEM提高了危害领域识别的准确性,实验结果表明其在安全评估中具有广泛的应用潜力。
本研究提出了“Think”框架,以解决大型语言模型在属性文本生成中的幻觉和事实错误问题。通过自引导蒙特卡罗树搜索和进展奖励模型的实验,结果显示该方法显著优于现有技术,具有重要影响。
本研究提出了一种结合蒙特卡罗树搜索和变换器架构的语法强化学习算法,有效解决图中路径和环的计数问题。新算法发现了新的矩阵计数公式,计算效率提高2到6倍,对网络分析有重要影响。
本研究提出了WebPilot系统,通过改善蒙特卡罗树搜索,解决了自动化代理在动态环境中执行复杂网页任务时的适应性不足问题。实验结果显示WebPilot在WebArena中的表现达到最新技术水平,成功率提升了93%。
OpenAI泄露了名为Q*的人工智能突破,它在小学数学方面表现出色。Q*是Q-learning和A*的组合。DeepMind正在研究与AlphaGo类似的蒙特卡罗树搜索。这些突破可能对规划和代理行为有重要影响。OpenAI的突破性Q*可能是解决数学问题的一种方法。虽然数学成绩只相当于小学生水平,但研究人员对Q*的未来成功非常乐观。
完成下面两步后,将自动完成登录并继续当前操作。