小红花·文摘

$LWD——大规模部署中训练VLA的RL框架：结合“分布隐式价值学习”与“基于QAM的策略提取”，先离线RL预训练，后在线RL微调中跑通“部署-数据收集-训练”的持续进化循环$

结构之法算法之道 ·

$π0.7——4层prompt下的技能组合泛化能力：先高层策略基于指令历史和当前画面输出子任务指令，后世界模型基于子任务指令生成子目标图像$

结构之法算法之道 ·

蚂蚁灵波开源的LingBot-VA是全球首个因果视频-动作模型，能够预测未来并执行任务，具备长期记忆和高效泛化能力，适应新任务。通过视频推演，机器人在复杂任务中表现优异，标志着通用机器人进入视频时代。

量子位 ·

在北京的世界机器人大会上，智平方展示了具备多任务处理能力的人形机器人爱宝。爱宝通过“超级大脑”GOVLA，实现全域感知、全身协同、长程柔性和快速学习，能够灵活适应不同场景，展现通用机器人的潜力。

量子位 ·

本研究探讨了构建通用机器人系统的方法，提出结合模块化设计与大规模学习以提高学习效率。研究表明，该方法能够有效实现零-shot操作，推动通用机器人代理的发展。

BriefGPT - AI 论文速递 ·

本研究提出了一种价值引导政策引导（V-GPS）方法，旨在解决通用机器人在多样化演示数据集上训练时的性能不一致问题。该方法通过离线强化学习的价值函数重新排序机器人的动作，显著提升了不同架构的机器人政策在多种平台和任务上的表现。

BriefGPT - AI 论文速递 ·

本研究提出了GR-2，一个先进的通用机器人代理，旨在解决机器人操作中的可变性和适应性问题。通过对3800万个视频片段进行预训练，GR-2在多种任务和新环境中实现了97.7%的成功率，展现出卓越的多任务学习和泛化能力。

BriefGPT - AI 论文速递 ·

RoboCat是一种自我改进的AI机器人代理，能够通过少量示范学习多种任务，并生成新训练数据以提升技能。它基于多模态模型Gato，结合大量图像和动作数据，快速适应不同的机器人手臂，学习效率高，成功率显著提高，标志着通用机器人发展的重要进展。

Google DeepMind Blog ·