小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

2025谷歌研究学者计划名单:吴佳俊、Mamba作者Albert Gu、Tri Dao等获奖

机器之心
机器之心 · 2025-06-13T09:47:33Z
李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

研究者提出了一种名为FlowMo的图像tokenization改进方案,通过两阶段训练提升图像重建质量。FlowMo在ImageNet-1K数据集上表现优异,采用基于Transformer的扩散自编码器,优化了图像压缩与重建过程。

李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

机器之心
机器之心 · 2025-03-20T06:30:46Z
斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战

研究者提出了一种名为扩散自蒸馏(DSD)的方法,通过预训练的文本到图像模型生成数据集,提升图像生成的一致性和定制性。DSD在零样本定制图像生成方面优于现有方法,适用于多种任务,无需微调或训练个性化模型。

斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战

机器之心
机器之心 · 2024-11-29T06:43:18Z

李飞飞和吴佳俊团队推出了具身智能决策能力的评估基准EAI,全面评估了18款主流模型。测试结果显示,o1-preview在BEHAVIOR和VirtualHome环境中均获第一,促进了对大模型优缺点的深入理解。

李飞飞吴佳俊团队推出具身智能决策能力评价基准,o1-preview登顶

量子位
量子位 · 2024-11-14T09:31:46Z
一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解

斯坦福团队提出的“场景语言”将自然语言转化为三维场景,结合程序语言、自然语言和神经网络,显著提升了AI生成和编辑3D场景的能力,展现了在游戏和建筑设计等领域的创新潜力。

一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解

机器之心
机器之心 · 2024-11-13T06:26:42Z

斯坦福大学的李飞飞和吴佳俊团队推出了HourVideo数据集,以评估长视频理解能力。该数据集包含500个第一人称视角的视频,时长20至120分钟,涵盖77种日常活动。实验结果表明,现有多模态模型在长视频理解方面的表现远低于人类专家,亟需改进。

空间智能版ImageNet来了!李飞飞吴佳俊团队出品

量子位
量子位 · 2024-11-10T05:00:55Z

斯坦福吴佳俊团队与MIT合作开发的WonderWorld,能够在10秒内实时生成3D场景,速度比现有方法快近100倍。用户只需上传一张图片,即可交互生成无限扩展的虚拟世界,支持多种场景和视觉风格,显著提升了交互式3D生成的可能性。

10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成

量子位
量子位 · 2024-10-26T08:51:38Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码