小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
MEM——解决VLA长时记忆问题的框架:短时靠高效视频编码抓细节,长线凭文本记忆系统记进度

PI公司提出了一种多尺度具身记忆(MEM)架构,结合短期视觉记忆和长期语言记忆,以提升机器人在复杂任务中的表现。该系统通过视频编码器处理短期记忆,并利用语言机制跟踪长期事件,使机器人能够有效执行长达15分钟的任务,如厨房整理,同时解决了遮挡问题,增强了在动态环境中的适应能力。

MEM——解决VLA长时记忆问题的框架:短时靠高效视频编码抓细节,长线凭文本记忆系统记进度

结构之法 算法之道
结构之法 算法之道 · 2026-04-11T16:22:06Z

本文探讨了“及时”世界建模的研究,强调基于模拟的推理如何支持人类规划。提出了一种新颖的JIT框架,通过实时构建心理地图和选择性信息收集,实现高效决策。实验表明,JIT系统在处理环境时存储的信息量显著低于传统方法,但仍能做出高质量预测。未来研究应关注动态环境中的信息选择。

“及时”世界建模支持人类规划与推理

KDnuggets
KDnuggets · 2026-04-02T16:00:19Z
DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

本文回顾了作者创业11年的历程,并介绍了上海AI LAB发布的DualVLN模型。该模型结合视觉-语言导航推理与实时控制,采用双系统架构,分别负责高层推理和低层动作执行,提升了动态环境中的导航能力。实验结果表明,DualVLN在多种场景中表现优异,成功率高,导航误差低。

DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

结构之法 算法之道
结构之法 算法之道 · 2026-01-19T10:48:45Z
Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合:系统1做慢思考且通过价值评估选择对应的动作片段,让系统2持续扩散去噪

本文介绍了Hume模型,该模型结合双系统思维(System-1和System-2),提升机器人在复杂任务中的表现。Hume通过价值引导的重复采样和级联动作去噪机制,实现高效的动作预测和实时控制。System-2生成候选动作并评估其价值,System-1则快速执行细化动作,使机器人能够灵活应对动态环境。

Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合:系统1做慢思考且通过价值评估选择对应的动作片段,让系统2持续扩散去噪

结构之法 算法之道
结构之法 算法之道 · 2025-12-29T11:03:03Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

本文介绍了《智能体设计模式》第九章,讨论智能体如何通过学习与适应提升性能,涵盖强化学习、监督学习、无监督学习等方法,以及自我改进编码智能体(SICA)和Google的AlphaEvolve系统,强调智能体在动态环境中的自主学习与优化能力。

《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

实时互动网
实时互动网 · 2025-10-28T02:56:20Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第六章 规划

本文翻译了《智能体设计模式》第六章,强调规划在智能体编程中的重要性。规划帮助智能体将复杂目标分解为可管理的步骤,并自主制定实现策略。智能体通过适应性应对变化,优化任务执行,尤其在动态环境中表现优异。规划模式为复杂问题提供结构化解决方案,提升智能体执行能力。

《Agentic Design Patterns:构建智能系统的实战指南》- 第六章 规划

实时互动网
实时互动网 · 2025-10-23T02:39:19Z
ResMimic——类似预训练-微调模式的人形行走-操作:先预训练一个通用运动跟踪策略,后针对特定任务做修正(非盲态部署时依赖动捕)

本文介绍了ResMimic,一个用于人形机器人行走与操作的两阶段残差学习框架。该框架结合预训练的通用运动跟踪策略和任务特定的残差策略,提升了机器人在动态环境中的操作能力。研究表明,ResMimic在多样化运动操控任务中表现出色,能够有效应对物体交互,展示了其在现实世界中的应用潜力。

ResMimic——类似预训练-微调模式的人形行走-操作:先预训练一个通用运动跟踪策略,后针对特定任务做修正(非盲态部署时依赖动捕)

结构之法 算法之道
结构之法 算法之道 · 2025-10-12T03:13:00Z
Agent设计模式——第 11 章:目标设定和监控

要使AI代理有效,需设定明确目标并监控进度。通过规划,代理可自主生成步骤,适应变化,处理复杂任务。目标设定和监控确保代理在动态环境中可靠运行,适用于客户服务和学习系统等领域。

Agent设计模式——第 11 章:目标设定和监控

XINDOO的博客
XINDOO的博客 · 2025-10-04T16:00:03Z
Agent设计模式——第 6 章:规划

规划模式使智能代理能够将复杂目标分解为可操作步骤,适应动态环境并生成有效计划,尤其在自动化多步任务和复杂工作流中至关重要,现代语言模型对此提供支持。

Agent设计模式——第 6 章:规划

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:58:50Z
InternVLA-N1——规划-执行双系统下的VLN基础模型:具备学习型的潜在规划能力,可部署在轮式、四足、双足人形上(含我司复现实践)

本文介绍了InternVLA-N1,一个结合视觉和语言指令的双系统导航模型,具备学习型潜在规划能力,提升了机器人在动态环境中的表现。研究者构建了大规模数据集InternData-N1以支持模型训练,并在多个基准上验证了其有效性。

InternVLA-N1——规划-执行双系统下的VLN基础模型:具备学习型的潜在规划能力,可部署在轮式、四足、双足人形上(含我司复现实践)

结构之法 算法之道
结构之法 算法之道 · 2025-09-19T14:25:01Z

TrackVLA是一种集成目标识别与轨迹规划的视觉-语言-动作模型,旨在解决具身视觉跟踪任务。通过联合训练,该模型在动态环境中展现出优越的识别与规划能力,提升了智能体在复杂场景中的跟踪效果。

TrackVLA——开放世界下的四足具身视觉跟踪EVT(智能跟随):集目标识别与轨迹规划为一体的VLA,不怕高动态与遮挡

结构之法 算法之道
结构之法 算法之道 · 2025-08-05T10:58:25Z
机器人,认识你自己:新视觉系统教会机器理解自身

麻省理工学院研究人员开发的神经雅可比场(NJF)系统,使机器人能够通过视觉学习自我运动控制,无需复杂传感器或编程。这一方法提升了软机器人在动态环境中的适应能力,未来可广泛应用于农业和建筑等领域。

机器人,认识你自己:新视觉系统教会机器理解自身

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-07-24T19:30:00Z

淘天提出的Mobile-R1是一个任务级奖励的交互式强化学习框架,旨在提高移动代理的适应性和探索能力。通过三阶段训练流程和高质量轨迹数据集,Mobile-R1在动态环境中的任务成功率达到49.40%,显著优于其他基准模型。

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

量子位
量子位 · 2025-07-20T06:48:17Z

本研究提出了一种反射世界模型(RWM)双重控制框架,旨在解决动态环境中学习控制策略的应用问题。该方法具有快速适应和低计算成本的优势,性能接近最优水平。

世界模型作为快速运动适应的参考轨迹

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

自去年Q4以来,我司专注于具身智能应用开发,需求持续增长。本周,国企和知名企业频繁联系,涉及多个行业。研究者关注CMU和UCSD的最新进展,提出自适应运动优化(AMO)框架,旨在解决人形机器人全身控制的挑战,结合强化学习和轨迹优化,提升机器人在动态环境中的操作能力。

人形loco-manipulation专题——涵盖Mobile-TeleVision、下肢RL-上肢模仿的AMO、上下双智能体联合训练的FALCON

结构之法 算法之道
结构之法 算法之道 · 2025-05-20T14:55:34Z
2025年最佳五款免费反向代理解决方案

随着网络应用复杂性增加,反向代理的重要性日益突出。2025年,五款免费反向代理解决方案包括:SafeLine(安全性)、Nginx(负载均衡)、Traefik(动态环境)、HAProxy(企业级可靠性)和Caddy(易用性)。选择合适的反向代理需根据具体需求,SafeLine在安全性方面表现优异。

2025年最佳五款免费反向代理解决方案

DEV Community
DEV Community · 2025-05-16T09:10:02Z

本研究分析了大型语言模型在动态环境中的自我学习与推理能力,指出其在计划、推理和空间协调方面的局限性,并强调多样化推理方法的重要性。

深入理解大型语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了动态环境中目标识别的新定义,旨在提升实时目标识别系统的能力,采用无模型强化学习方法,展示了快速适应变化任务的能力。

General Dynamic Target Recognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了一种新颖的世界建模框架WM3C,旨在解决强化学习中智能体在未知动态环境下的泛化问题。实验结果表明,WM3C在适应新任务、识别潜在过程和改进策略学习方面显著优于现有方法。

Reinforcement Learning in Unknown Environments through Language-Guided Composable Causal Component Modeling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种双系统自适应决策框架(DSADF),结合快速直觉的强化学习代理与深度分析的视觉语言模型,显著提升动态环境中的决策能力。

Dual-System Adaptive Decision Framework: The Application of Fast and Slow Thinking in Decision-Making

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码