小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
研究人员教大型语言模型解决复杂规划挑战

麻省理工学院的研究人员开发了一种框架,利用大型语言模型(LLM)解决复杂优化问题。用户通过自然语言描述问题,LLM将其转化为数学模型并调用优化求解器。该框架在九个复杂挑战中成功率达到85%,显著高于传统方法。未来,研究人员希望LLMFP能处理图像输入,以应对更复杂的规划任务。

研究人员教大型语言模型解决复杂规划挑战

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-04-02T04:00:00Z

本研究提出了ACPBench Hard,以评估现有模型在规划任务中的推理能力。结果显示,最先进的语言模型在这些任务中的准确率未超过65%,表明仍需改进。

ACPBench Hard:关于行动、变化和规划的无限制推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

DeepMind的新研究“Mind Evolution”结合遗传算法,将大语言模型在规划任务中的成功率从5%提升至95%。该方法无需微调,显著降低成本,能够直接处理自然语言问题,避免了传统方法的复杂性。实验结果显示,Mind Evolution在各种任务中表现优异,尤其在复杂任务中更具优势。

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

量子位
量子位 · 2025-01-23T06:28:57Z

亚利桑那州立大学的研究表明,o1-preview在复杂规划任务中表现优于o1-mini,尤其在Blockworlds任务中准确率达到98%,而mini仅为56.6%。尽管o1-preview在规划能力上表现出色,但在识别不可解问题和处理长任务时仍有不足,且成本较高,需权衡性能与成本。

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

量子位
量子位 · 2024-09-28T05:40:16Z

本文介绍了世界上第一个真实世界的自动驾驶数据集和基准测试,用于测试机器学习规划器在多样化行驶场景中的能力。该研究分析了基于机器学习和传统方法之间的差距。

城市驾驶的混合模仿学习运动规划器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码