小红花·文摘 - 小红花技术领袖俱乐部

具身智能“高考”难疯了！人类100分，最强模型12.8

量子位 ·

本研究探讨深度强化学习的泛化能力，提出整合鲁棒适应模块的框架，以增强对环境动态的识别与应对，显示出在多种仿真任务中的有效性。

GRAM: Generalization in Deep Reinforcement Learning with Robust Adaptation Module

BriefGPT - AI 论文速递 ·

英伟达提出的DexMimicGen方法仅需5次演示即可生成1000个新演示，仿真任务成功率高达97%。该方法有效解决了机器人训练数据不足的问题，展现出强大的生成能力和跨任务泛化能力。

英伟达团队机器训练新方法！仅5次演示让机器生成1000个新demo，李飞飞高徒与徒孙联手出品

量子位 ·