代理人工智能(Agentic AI)是能够自主规划、行动和自我改进的系统,代表了AI的重大进步。与传统模型不同,代理AI具备多步骤自主性,能够设定目标、执行计划并总结结果。其核心模块包括规划、记忆和工具使用,使其能够适应环境并持续学习,从而提高效率和准确性。
现代AI代理模型已内化ReAct框架,具备自主规划和工具调用能力。ReAct强调思考、行动和观察的循环,使AI能够像人类一样解决复杂问题,提升智能和可靠性,无需详细提示词。
波士顿动力的Atlas机器人升级为Atlas MTS,具备自然语言理解、自主规划和应对意外的能力。新模型基于大型行为模型(LBM),采用4.5亿参数的扩散Transformer,能够精准执行人类演示的动作。这次升级标志着机器人从液压驱动转向电驱动,提升了性能和适应性。
2025世界机器人大会将于8月在北京举行,澳鹏数据分享了具身智能数据基础设施的创新实践。副总裁钱程强调数据是AI大模型与具身智能融合的核心,呼吁推动具身智能机器人快速量产。澳鹏推出RoboGo平台,结合多视角3D重建与视频理解,提升机器人操作精度与自主规划能力。
亚马逊网络服务开源了Strands Agents SDK,旨在简化AI代理的开发。该SDK由模型、工具和提示三部分组成,支持自主规划和交互,集成多种模型和工具,适用于多种应用场景,从而提升开发效率和灵活性。
本研究提出了改进算法AoT+,有效解决了大语言模型在自主规划中的不足,使其在规划基准测试中超越了以往方法和人类基准,展现了生成长期计划的能力。
研究指出语言智能体在自主规划中存在短板,主要因约束条件作用有限和问题影响减弱。现有策略虽有改善,但未能彻底解决,表明智能体距人类智能仍有挑战。
该研究利用双层马尔可夫决策过程(MDP)框架,提高科学任务的自主规划能力。此方法能快速计算决策,适应计划延误或偏差。通过转化为双层MDP,增强AI解决方案的可解释性和可信度,并在RoverGridWorld环境中测试,展示了计算处理能力和近似最佳策略,强调计算时间与策略最优性之间的权衡。
本文介绍了一种智能四旋翼无人机的自主规划系统,结合动态障碍物跟踪和轨迹预测,实现高效飞行。系统使用轻量级目标检测算法和卡尔曼滤波来识别和跟踪动态障碍物,并通过B样条轨迹搜索算法优化路径。实验显示,该方法在实时检测和避障方面优于现有方法。此外,研究还探讨了与大型语言模型的集成,以提升人机交互体验。
该研究利用双层马尔可夫决策过程(MDP)框架,提高科学任务的自主规划效率。此方法能快速计算决策,处理任务延误或偏差。通过将任务规划转化为双层MDP,增强了AI解决方案的可解释性。在RoverGridWorld环境测试中,展示了计算处理能力和近似最佳策略,并强调了计算时间与策略最优性之间的权衡。
本文研究了LLLms在常识规划任务中的能力,通过国际计划竞赛评估了其在自主规划和启发式模式下的表现。发现LLLms在自主规划方面有限,但在启发式模式下,其生成的计划可以改善搜索过程并提供反馈验证计划质量。
完成下面两步后,将自动完成登录并继续当前操作。