小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
NVIDIA研究推动机器人技术从模拟走向现实

NVIDIA的研究展示了机器人在动态环境中从模拟到现实的转变,强调了其感知、推理和行动的能力。通过新方法COMPASS和Grasp-MPC,机器人在复杂任务中展现出更高的成功率和适应性,为机器人技术在真实世界中的应用奠定了基础。

NVIDIA研究推动机器人技术从模拟走向现实

NVIDIA Blog
NVIDIA Blog · 2026-05-28T13:00:51Z
MEM——解决VLA长时记忆问题的框架:短时靠高效视频编码抓细节,长线凭文本记忆系统记进度

PI公司提出了一种多尺度具身记忆(MEM)架构,结合短期视觉记忆和长期语言记忆,以提升机器人在复杂任务中的表现。该系统通过视频编码器处理短期记忆,并利用语言机制跟踪长期事件,使机器人能够有效执行长达15分钟的任务,如厨房整理,同时解决了遮挡问题,增强了在动态环境中的适应能力。

MEM——解决VLA长时记忆问题的框架:短时靠高效视频编码抓细节,长线凭文本记忆系统记进度

结构之法 算法之道
结构之法 算法之道 · 2026-04-11T16:22:06Z

本文探讨了“及时”世界建模的研究,强调基于模拟的推理如何支持人类规划。提出了一种新颖的JIT框架,通过实时构建心理地图和选择性信息收集,实现高效决策。实验表明,JIT系统在处理环境时存储的信息量显著低于传统方法,但仍能做出高质量预测。未来研究应关注动态环境中的信息选择。

“及时”世界建模支持人类规划与推理

KDnuggets
KDnuggets · 2026-04-02T16:00:19Z
DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

本文回顾了作者创业11年的历程,并介绍了上海AI LAB发布的DualVLN模型。该模型结合视觉-语言导航推理与实时控制,采用双系统架构,分别负责高层推理和低层动作执行,提升了动态环境中的导航能力。实验结果表明,DualVLN在多种场景中表现优异,成功率高,导航误差低。

DualVLN——基于像素目标点的双系统VLN基础模型:VLM做全局规划且预测中期路径,DiT策略头依托高频RGR输入和“来自VLM的低频潜在特征”生成动作轨迹

结构之法 算法之道
结构之法 算法之道 · 2026-01-19T10:48:45Z
Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合:系统1做慢思考且通过价值评估选择对应的动作片段,让系统2持续扩散去噪

本文介绍了Hume模型,该模型结合双系统思维(System-1和System-2),提升机器人在复杂任务中的表现。Hume通过价值引导的重复采样和级联动作去噪机制,实现高效的动作预测和实时控制。System-2生成候选动作并评估其价值,System-1则快速执行细化动作,使机器人能够灵活应对动态环境。

Hume——系统1(VLM+评估头+动作头)与系统2(动作头)的组合:系统1做慢思考且通过价值评估选择对应的动作片段,让系统2持续扩散去噪

结构之法 算法之道
结构之法 算法之道 · 2025-12-29T11:03:03Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

本文介绍了《智能体设计模式》第九章,讨论智能体如何通过学习与适应提升性能,涵盖强化学习、监督学习、无监督学习等方法,以及自我改进编码智能体(SICA)和Google的AlphaEvolve系统,强调智能体在动态环境中的自主学习与优化能力。

《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应

实时互动网
实时互动网 · 2025-10-28T02:56:20Z
《Agentic Design Patterns:构建智能系统的实战指南》- 第六章 规划

本文翻译了《智能体设计模式》第六章,强调规划在智能体编程中的重要性。规划帮助智能体将复杂目标分解为可管理的步骤,并自主制定实现策略。智能体通过适应性应对变化,优化任务执行,尤其在动态环境中表现优异。规划模式为复杂问题提供结构化解决方案,提升智能体执行能力。

《Agentic Design Patterns:构建智能系统的实战指南》- 第六章 规划

实时互动网
实时互动网 · 2025-10-23T02:39:19Z
ResMimic——类似预训练-微调模式的人形行走-操作:先预训练一个通用运动跟踪策略,后针对特定任务做修正(非盲态部署时依赖动捕)

本文介绍了ResMimic,一个用于人形机器人行走与操作的两阶段残差学习框架。该框架结合预训练的通用运动跟踪策略和任务特定的残差策略,提升了机器人在动态环境中的操作能力。研究表明,ResMimic在多样化运动操控任务中表现出色,能够有效应对物体交互,展示了其在现实世界中的应用潜力。

ResMimic——类似预训练-微调模式的人形行走-操作:先预训练一个通用运动跟踪策略,后针对特定任务做修正(非盲态部署时依赖动捕)

结构之法 算法之道
结构之法 算法之道 · 2025-10-12T03:13:00Z
Agent设计模式——第 11 章:目标设定和监控

要使AI代理有效,需设定明确目标并监控进度。通过规划,代理可自主生成步骤,适应变化,处理复杂任务。目标设定和监控确保代理在动态环境中可靠运行,适用于客户服务和学习系统等领域。

Agent设计模式——第 11 章:目标设定和监控

XINDOO的博客
XINDOO的博客 · 2025-10-04T16:00:03Z
Agent设计模式——第 6 章:规划

规划模式使智能代理能够将复杂目标分解为可操作步骤,适应动态环境并生成有效计划,尤其在自动化多步任务和复杂工作流中至关重要,现代语言模型对此提供支持。

Agent设计模式——第 6 章:规划

XINDOO的博客
XINDOO的博客 · 2025-10-04T15:58:50Z
InternVLA-N1——规划-执行双系统下的VLN基础模型:具备学习型的潜在规划能力,可部署在轮式、四足、双足人形上(含我司复现实践)

本文介绍了InternVLA-N1,一个结合视觉和语言指令的双系统导航模型,具备学习型潜在规划能力,提升了机器人在动态环境中的表现。研究者构建了大规模数据集InternData-N1以支持模型训练,并在多个基准上验证了其有效性。

InternVLA-N1——规划-执行双系统下的VLN基础模型:具备学习型的潜在规划能力,可部署在轮式、四足、双足人形上(含我司复现实践)

结构之法 算法之道
结构之法 算法之道 · 2025-09-19T14:25:01Z

TrackVLA是一种集成目标识别与轨迹规划的视觉-语言-动作模型,旨在解决具身视觉跟踪任务。通过联合训练,该模型在动态环境中展现出优越的识别与规划能力,提升了智能体在复杂场景中的跟踪效果。

TrackVLA——开放世界下的四足具身视觉跟踪EVT(智能跟随):集目标识别与轨迹规划为一体的VLA,不怕高动态与遮挡

结构之法 算法之道
结构之法 算法之道 · 2025-08-05T10:58:25Z
机器人,认识你自己:新视觉系统教会机器理解自身

麻省理工学院研究人员开发的神经雅可比场(NJF)系统,使机器人能够通过视觉学习自我运动控制,无需复杂传感器或编程。这一方法提升了软机器人在动态环境中的适应能力,未来可广泛应用于农业和建筑等领域。

机器人,认识你自己:新视觉系统教会机器理解自身

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-07-24T19:30:00Z

淘天提出的Mobile-R1是一个任务级奖励的交互式强化学习框架,旨在提高移动代理的适应性和探索能力。通过三阶段训练流程和高质量轨迹数据集,Mobile-R1在动态环境中的任务成功率达到49.40%,显著优于其他基准模型。

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

量子位
量子位 · 2025-07-20T06:48:17Z

本研究提出了一种反射世界模型(RWM)双重控制框架,旨在解决动态环境中学习控制策略的应用问题。该方法具有快速适应和低计算成本的优势,性能接近最优水平。

世界模型作为快速运动适应的参考轨迹

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

自去年Q4以来,我司专注于具身智能应用开发,需求持续增长。本周,国企和知名企业频繁联系,涉及多个行业。研究者关注CMU和UCSD的最新进展,提出自适应运动优化(AMO)框架,旨在解决人形机器人全身控制的挑战,结合强化学习和轨迹优化,提升机器人在动态环境中的操作能力。

人形loco-manipulation专题——涵盖Mobile-TeleVision、下肢RL-上肢模仿的AMO、上下双智能体联合训练的FALCON

结构之法 算法之道
结构之法 算法之道 · 2025-05-20T14:55:34Z
2025年最佳五款免费反向代理解决方案

随着网络应用复杂性增加,反向代理的重要性日益突出。2025年,五款免费反向代理解决方案包括:SafeLine(安全性)、Nginx(负载均衡)、Traefik(动态环境)、HAProxy(企业级可靠性)和Caddy(易用性)。选择合适的反向代理需根据具体需求,SafeLine在安全性方面表现优异。

2025年最佳五款免费反向代理解决方案

DEV Community
DEV Community · 2025-05-16T09:10:02Z

本研究分析了大型语言模型在动态环境中的自我学习与推理能力,指出其在计划、推理和空间协调方面的局限性,并强调多样化推理方法的重要性。

深入理解大型语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了动态环境中目标识别的新定义,旨在提升实时目标识别系统的能力,采用无模型强化学习方法,展示了快速适应变化任务的能力。

General Dynamic Target Recognition

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了一种新颖的世界建模框架WM3C,旨在解决强化学习中智能体在未知动态环境下的泛化问题。实验结果表明,WM3C在适应新任务、识别潜在过程和改进策略学习方面显著优于现有方法。

Reinforcement Learning in Unknown Environments through Language-Guided Composable Causal Component Modeling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码