美国东北大学与波士顿动力RAI联合提出的HEP框架,通过坐标系转移接口实现机器人高效学习。该框架的分层结构提升了灵活性,自动适应空间变化,显著降低了数据依赖。实验结果显示,HEP在复杂任务中的成功率提升了60%,为未来多模态智能体集成提供了新路径。
本研究提出了WebPilot系统,通过改善蒙特卡罗树搜索,解决了自动化代理在动态环境中执行复杂网页任务时的适应性不足问题。实验结果显示WebPilot在WebArena中的表现达到最新技术水平,成功率提升了93%。
该论文提出了一种新的自主导航系统中目标导航的方法,称为深度推理终止代理(DITA),通过将监督模型与强化学习相结合来隐式推断目标的深度并决定结束。评估显示该方法在各个房间类型上取得了9.3%的成功率提升,并在长期轨迹环境上取得了51.2%的改进。
完成下面两步后,将自动完成登录并继续当前操作。