RDT2是一种新型机器人基础模型,旨在实现跨本体、物体和场景的零样本迁移能力。通过使用UMI数据集和三阶段训练策略,RDT2能够高效处理多样化的真实世界任务,提升机器人在未见物体和场景中的泛化能力。该模型在微调实验中表现优异,尤其在复杂操作和动态任务中,展现出显著的性能提升。
斯坦福大学李飞飞团队提出“数字表亲”概念,通过ACDC方法将真实数据转化为模拟数据,提升机器人学习的泛化能力。数字表亲保留几何和语义特质,实验显示其在零样本迁移中成功率达90%,优于数字孪生。ACDC自动生成交互场景,降低成本并提高跨域泛化。
本研究提出了一种新方法,通过人类示范学习多样的双手灵巧技能。BiDexHD框架在多任务间共享行为,推动了通用双手操控的进展。在TACO数据集上,任务完成率达到84.59%,显示了其在零样本迁移方面的有效性。
该论文探讨了多语言预训练语言模型的研究进展,包括零样本迁移学习、结构化剪枝和翻译能力提升。研究提出动态稀疏化方法,以增强非英语语言模型的能力,并分析了多语言模型的偏见与挑战。实验结果表明,微调大型语言模型显著提高了翻译质量,尤其在多语言翻译任务中。
本文提出了一种基于二叉决策树的稀疏编码方法,应用于对象识别,展示了其有效性。研究了物体中心表示学习及其在多目标数据集上的表现,提出的新模型GENESIS-v2优于现有模型。此外,探讨了基于对象的学习如何提高视觉动力学预测的准确性,并提出了新的微调策略以增强零样本迁移能力。
本研究提出了GLEE,一个用于图像和视频中对象定位与识别的基础模型。GLEE通过统一框架实现检测、分割和跟踪等功能,具备强大的零样本迁移能力,适用于多模态任务。研究还探讨了基于语义部件分割的神经框架和细粒度few-shot识别方法,展示了其在目标解析和3D部分识别中的优越性能。
本研究首次引入了视觉模型的预训练不确定性模块,实现了零样本迁移。通过解决梯度冲突,训练速度提升了180倍。预训练的不确定性能够泛化到未见过的数据集,捕捉了基本不确定性。所有预训练的检查点和代码已发布。
该文介绍了基于回归的离线GCRL算法GoFAR,通过状态匹配方法解决目标达成任务问题,实现了零样本迁移。实验证明,GoFAR在各种问题和任务中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。