小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

2025谷歌研究学者计划名单:吴佳俊、Mamba作者Albert Gu、Tri Dao等获奖

机器之心
机器之心 · 2025-06-13T09:47:33Z
李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

研究者提出了一种名为FlowMo的图像tokenization改进方案,通过两阶段训练提升图像重建质量。FlowMo在ImageNet-1K数据集上表现优异,采用基于Transformer的扩散自编码器,优化了图像压缩与重建过程。

李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

机器之心
机器之心 · 2025-03-20T06:30:46Z
斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战

研究者提出了一种名为扩散自蒸馏(DSD)的方法,通过预训练的文本到图像模型生成数据集,提升图像生成的一致性和定制性。DSD在零样本定制图像生成方面优于现有方法,适用于多种任务,无需微调或训练个性化模型。

斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战

机器之心
机器之心 · 2024-11-29T06:43:18Z

李飞飞和吴佳俊团队推出了具身智能决策能力的评估基准EAI,全面评估了18款主流模型。测试结果显示,o1-preview在BEHAVIOR和VirtualHome环境中均获第一,促进了对大模型优缺点的深入理解。

李飞飞吴佳俊团队推出具身智能决策能力评价基准,o1-preview登顶

量子位
量子位 · 2024-11-14T09:31:46Z
一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解

斯坦福团队提出的“场景语言”将自然语言转化为三维场景,结合程序语言、自然语言和神经网络,显著提升了AI生成和编辑3D场景的能力,展现了在游戏和建筑设计等领域的创新潜力。

一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解

机器之心
机器之心 · 2024-11-13T06:26:42Z

斯坦福大学的李飞飞和吴佳俊团队推出了HourVideo数据集,以评估长视频理解能力。该数据集包含500个第一人称视角的视频,时长20至120分钟,涵盖77种日常活动。实验结果表明,现有多模态模型在长视频理解方面的表现远低于人类专家,亟需改进。

空间智能版ImageNet来了!李飞飞吴佳俊团队出品

量子位
量子位 · 2024-11-10T05:00:55Z

斯坦福吴佳俊团队与MIT合作开发的WonderWorld,能够在10秒内实时生成3D场景,速度比现有方法快近100倍。用户只需上传一张图片,即可交互生成无限扩展的虚拟世界,支持多种场景和视觉风格,显著提升了交互式3D生成的可能性。

10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成

量子位
量子位 · 2024-10-26T08:51:38Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码