小红花·文摘

$HumanEgo——从半小时人类第一视角视频中进行零样本学习的4大关键点：对人类手臂进行图像修补、将每只手和每个物体编码为一个交互中心Token、流匹配策略、稠密辅助目标$

结构之法算法之道 ·

$RDT2——基于UMI数据实现零样本且跨本体的泛化：先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)$

结构之法算法之道 ·

机器之心 ·

本研究提出了一种新方法，通过人类示范学习多样的双手灵巧技能。BiDexHD框架在多任务间共享行为，推动了通用双手操控的进展。在TACO数据集上，任务完成率达到84.59%，显示了其在零样本迁移方面的有效性。

BriefGPT - AI 论文速递 ·

该论文探讨了多语言预训练语言模型的研究进展，包括零样本迁移学习、结构化剪枝和翻译能力提升。研究提出动态稀疏化方法，以增强非英语语言模型的能力，并分析了多语言模型的偏见与挑战。实验结果表明，微调大型语言模型显著提高了翻译质量，尤其在多语言翻译任务中。

BriefGPT - AI 论文速递 ·

本文提出了一种基于二叉决策树的稀疏编码方法，应用于对象识别，展示了其有效性。研究了物体中心表示学习及其在多目标数据集上的表现，提出的新模型GENESIS-v2优于现有模型。此外，探讨了基于对象的学习如何提高视觉动力学预测的准确性，并提出了新的微调策略以增强零样本迁移能力。

BriefGPT - AI 论文速递 ·

本研究提出了GLEE，一个用于图像和视频中对象定位与识别的基础模型。GLEE通过统一框架实现检测、分割和跟踪等功能，具备强大的零样本迁移能力，适用于多模态任务。研究还探讨了基于语义部件分割的神经框架和细粒度few-shot识别方法，展示了其在目标解析和3D部分识别中的优越性能。

BriefGPT - AI 论文速递 ·

本研究首次引入了视觉模型的预训练不确定性模块，实现了零样本迁移。通过解决梯度冲突，训练速度提升了180倍。预训练的不确定性能够泛化到未见过的数据集，捕捉了基本不确定性。所有预训练的检查点和代码已发布。

BriefGPT - AI 论文速递 ·

该文介绍了基于回归的离线GCRL算法GoFAR，通过状态匹配方法解决目标达成任务问题，实现了零样本迁移。实验证明，GoFAR在各种问题和任务中表现优异。

BriefGPT - AI 论文速递 ·