小红花·文摘

在10月23日的长沙程序员节开幕式上，开发者被邀请来长沙工作与创业。文章介绍了改进的3D扩散策略iDP3和OKAMI人形机器人，后者通过单个RGB视频模仿人类操作，并结合视觉模型识别物体，提升在不同环境中的操作能力。

斯坦福iDP3——改进3D扩散策略以赋能人形机器人的训练：不再依赖相机校准和点云分割(含DP3的详解)

结构之法算法之道 ·

本文介绍了多种基于扩散模型的机器人学习方法，包括3D扩散策略（DP3）和变分扩散蒸馏（VDD），这些方法在复杂行为学习中表现出色，具有高成功率和良好的泛化能力。此外，提出了深度扩散策略梯度（DDiffPG）算法，能够有效学习多模态策略，并在高维控制任务中实现动态在线重新规划。这些方法显著提升了机器人学习的效率和性能。

稀疏扩散策略：一种稀疏、可重复和灵活的机器人学习策略

BriefGPT - AI 论文速递 ·