吴佳俊团队最新研究成果汇总：从图像处理到3D世界生成的突破 - 小红花·文摘 - 小红花技术领袖俱乐部

沉浸式翻译 immersive translate

2025谷歌研究学者计划名单：吴佳俊、Mamba作者Albert Gu、Tri Dao等获奖

机器之心 ·

李飞飞、吴佳俊团队新作：不需要卷积和GAN，更好的图像tokenizer来了

李飞飞、吴佳俊团队新作：不需要卷积和GAN，更好的图像tokenizer来了

机器之心 ·

斯坦福吴佳俊扩散自蒸馏来了！突破文生图身份保留挑战

斯坦福吴佳俊扩散自蒸馏来了！突破文生图身份保留挑战

机器之心 ·

李飞飞和吴佳俊团队推出了具身智能决策能力的评估基准EAI，全面评估了18款主流模型。测试结果显示，o1-preview在BEHAVIOR和VirtualHome环境中均获第一，促进了对大模型优缺点的深入理解。

李飞飞吴佳俊团队推出具身智能决策能力评价基准，o1-preview登顶

量子位 ·

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

机器之心 ·

斯坦福大学的李飞飞和吴佳俊团队推出了HourVideo数据集，以评估长视频理解能力。该数据集包含500个第一人称视角的视频，时长20至120分钟，涵盖77种日常活动。实验结果表明，现有多模态模型在长视频理解方面的表现远低于人类专家，亟需改进。

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

量子位 ·

斯坦福吴佳俊团队与MIT合作开发的WonderWorld，能够在10秒内实时生成3D场景，速度比现有方法快近100倍。用户只需上传一张图片，即可交互生成无限扩展的虚拟世界，支持多种场景和视觉风格，显著提升了交互式3D生成的可能性。

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成

量子位 ·