微软亚洲研究院的ACE Talk系列讲座邀请北京大学副教授卢宗青,主题为“利用互联网视频扩展类人机器人学习”。他将探讨如何通过视觉-语言模型、动作模型和强化学习,利用互联网视频数据教授机器人类人技能。讲座定于6月11日举行,欢迎报名参加。
本研究提出了一种新颖的视觉条件多视角扩散模型See3D,旨在解决现有3D生成模型对有限标签的依赖,通过利用互联网视频实现开放世界的3D创作,显著提升生成能力。
Google DeepMind的开放创新团队推出了Genie,这是一个从互联网视频中学习的创新世界模型,能够根据图像提示创造出无限种可操作的2D世界。Genie具有广泛的通用性,不仅局限于二维空间。
完成下面两步后,将自动完成登录并继续当前操作。