小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

蒙特卡洛树扩散(MCTD)结合了蒙特卡洛树搜索与扩散模型,有效解决了扩散模型在长程推理中的可扩展性问题。在迷宫导航等任务中,MCTD的成功率接近100%。为提高效率,研究团队推出了快速MCTD,使推理速度提升100倍,显著降低计算开销。

图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight

量子位
量子位 · 2025-08-01T05:02:35Z

本研究提出了一种新方法——蒙特卡洛束搜索(MCBS),结合了束搜索、蒙特卡洛回路和TD3,有效解决了传统方法的探索不足问题。实验结果显示,MCBS在多个基准测试中优于传统TD3。

连续控制中演员-评论家强化学习的蒙特卡洛束搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种基于计算树逻辑的自然语言解释框架,旨在提升人工智能在顺序规划中的信任度。该框架有效地解释了蒙特卡洛树搜索算法,确保用户查询与环境动态的一致性,表现优异。

将大语言模型与基于逻辑的框架结合以解释蒙特卡洛树搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了一种基于蒙特卡洛概率推理的学习控制方法(MC-PILCO),旨在提升复杂机器人任务的控制效率。研究表明,MC-PILCO在物理系统中优于传统方法,有效解决了控制欠驱动系统的问题。

Model-Based Reinforcement Learning for Global Control in Underactuated Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本文提出了一种基于整洁评分的蒙特卡洛树搜索框架,利用RGB-D摄像头解决桌面整理问题。通过构建数据集和训练鉴别器,该方法能够在未知配置中评估整洁度并探索不同的整理路径,验证了其有效性。

整洁评分指导的蒙特卡洛树搜索用于视觉桌面整理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

将扩散模型与蒙特卡洛树搜索(MCTS)结合形成的蒙特卡洛树扩散(MCTD),通过重构去噪过程、引入元动作和快速去噪机制,提高了轨迹生成和优化的效率。实验结果表明,MCTD在长期任务中的表现优于其他方法。

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

机器之心
机器之心 · 2025-02-23T09:28:30Z

本研究解决了现有基于大型语言模型(LLM)的自主机器学习代理在代码生成时存在的低多样性和次优质量问题。我们提出了一种新的自省蒙特卡洛树搜索方法(I-MCTS),通过分析父节点和兄弟节点的解决方案来不断优化搜索树中的节点,从而提高决策过程的整体质量。实验证明,该方法在各种机器学习任务中相较于其他开源AutoML代理表现出6%的绝对性能提升。

I-MCTS:通过自省蒙特卡洛树搜索提升自主AutoML

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z
基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

该研究提出了一种新方法,利用生成模型和序列采样技术,通过序贯蒙特卡洛法在潜在空间中高效解决逆问题,效率是传统方法的三倍,适用于图像重建和不确定性量化等领域。

基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

DEV Community
DEV Community · 2025-02-12T10:01:15Z
敏捷预测:利用蒙特卡洛模拟和流量指标提升可预测性

在敏捷与瀑布方法的对抗中,敏捷团队面临项目时间预测的挑战。传统的确定性预测方法不适应现代软件开发的变化。敏捷预测结合历史数据和概率模型,利用流量指标和蒙特卡洛模拟,帮助团队在灵活性与可预测性之间取得平衡,提高交付准确性和风险管理能力。

敏捷预测:利用蒙特卡洛模拟和流量指标提升可预测性

DEV Community
DEV Community · 2025-02-11T20:46:24Z

本研究提出了蒙特卡洛树扩散(MCTD)框架,结合扩散模型与蒙特卡洛树搜索,解决了传统扩散模型的可扩展性问题。实验结果表明,MCTD在长期任务中优于现有基线,并在计算量增加时提供更高质量的解决方案。

蒙特卡洛树扩散用于系统2规划

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z
智能蒙特卡洛方法将AI语言模型计算成本降低40%

该研究提出了一种新颖的粒子蒙特卡洛方法,能够在推理时将大型语言模型的计算成本降低40%。该方法通过自适应计算的概率推理框架优化计算资源,同时保持模型质量,展现出比标准方法更高的效率。

智能蒙特卡洛方法将AI语言模型计算成本降低40%

DEV Community
DEV Community · 2025-02-06T09:06:44Z
通过扭曲序列蒙特卡洛实现数学问题的逐步推理

本文提出了一种基于扭曲序列蒙特卡洛(TSMC)的新验证方法,旨在提升大型语言模型(LLMs)的多步推理能力。该方法通过聚焦有前景的候选项,提高采样效率,减少样本需求,并简化训练目标,降低对人工标注的依赖。实验结果显示,该方法在多个数学基准上表现优越。

通过扭曲序列蒙特卡洛实现数学问题的逐步推理

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-01T00:00:00Z

该研究针对知识库问答(KBQA)中的弱KB意识、效率与效果的不平衡以及对标注数据的高依赖性等挑战,提出了一种新的方法KBQA-o1。通过引入基于ReAct的代理过程和蒙特卡洛树搜索(MCTS),该方法能够在探索KB环境的同时,逐步生成逻辑形式,并显著提高了在低标注数据条件下的表现,提升了Llama-3.1-8B模型在GrailQA上的F1得分至78.5%。

KBQA-o1:结合蒙特卡洛树搜索的主动知识库问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-31T00:00:00Z

本研究解决了在目标导向对话中有效识别和获取缺失信息的挑战。通过结合大语言模型生成最大化信息增益的问题、蒙特卡洛树搜索构建决策树,以及层级反馈机制的创新方法,提出了一种自适应问题提问的方法。实验结果显示,该方法在成功率上平均提高了12%,并且在对话过程中减少了10倍的语言模型调用次数,显著提升了信息获取的效率。

反馈意识蒙特卡洛树搜索方法在目标导向对话中的信息获取效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-25T00:00:00Z

本研究解决了大语言模型(LLM)在战略规划能力方面的不足,提出了一种新框架——MASTER,通过协调智能体的招募和沟通来增强LLM的蒙特卡洛树搜索(MCTS)能力。实验结果表明,该框架在多任务上表现出色,HotpotQA的准确率达到76%,WebShop达到80%,在这些数据集上创造了新的最先进性能。

MASTER:一个具有大语言模型专用蒙特卡洛树搜索的多智能体系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-24T00:00:00Z

本研究提出了一种新规划框架,将蒙特卡洛树搜索与主动推理目标结合,以解决不确定环境中探索与目标导向行为的平衡问题。该方法在连续控制任务中优于独立的CEM和随机回合的MCTS。

通过自由能量最小化提升蒙特卡洛树搜索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本文提出了一种结合蒙特卡洛树搜索与速度障碍技术的创新方法,旨在解决智能机器人在动态障碍物密集环境中的在线运动规划问题。实验结果显示,该方法在碰撞率、计算性能和任务表现上优于现有技术。

考虑速度障碍的蒙特卡洛树搜索:动态环境下安全高效的运动规划

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z

本研究提出了一种基于蒙特卡洛树搜索的启发式演化方法,旨在克服现有大语言模型在自动启发式设计中的局限性。该方法能够全面探索启发式空间,提高复杂任务的解决质量,具有重要的应用潜力。

基于蒙特卡洛树搜索的LLM自动启发式设计的全面探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

本研究提出了一种蒙特卡洛模拟算法,用于实时自适应控制器的策略改进。该算法通过统计每个动作的长期期望回报,显著降低了基础玩家的误差率,展现出较大的应用潜力。

基于蒙特卡洛搜索的在线策略改进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z
ReasoningAgent 更新 - 用于大语言模型推理的束搜索、蒙特卡洛树搜索和语言代理树搜索

本文介绍了ReasoningAgent的新版本,支持通过reason_config字典配置推理参数,新增蒙特卡洛树搜索(MCTS)和语言代理树搜索(LATS)作为搜索策略。用户可选择不同的搜索方法,支持多个独立推理树,并在提示中加入真实答案以生成训练数据,从而优化推理过程和数据生成。

ReasoningAgent 更新 - 用于大语言模型推理的束搜索、蒙特卡洛树搜索和语言代理树搜索

DEV Community
DEV Community · 2025-01-07T18:49:21Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码