量子位 ·

后生可畏！何恺明团队新成果发布，共一清华姚班大二在读

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

何恺明团队推出了改进版单步生成模型iMF，解决了训练的稳定性和效率问题。在ImageNet测试中，iMF表现优异，FID成绩为1.72，超越多步扩散模型，证明其性能可与之媲美。

🎯

关键要点

何恺明团队推出了改进版单步生成模型iMF，解决了训练的稳定性和效率问题。
iMF在ImageNet 256×256基准测试中取得了1.72的FID成绩，超越多步扩散模型。
iMF通过重构预测函数，将训练过程转换为标准的回归问题，提升了训练稳定性。
iMF引入灵活的无分类器指导（CFG），允许在推理时调整指导尺度以优化图像质量。
iMF采用高效的上下文内条件作用架构，减少了参数量，提高了模型效率。
iMF的实验结果显示，其性能优于许多从预训练多步模型中蒸馏而来的快进模型。
论文的共同作者包括清华姚班大二学生Yiyang Lu及多位知名研究员。

❓

延伸问答

何恺明团队的新模型iMF有什么主要改进？

iMF通过重构预测函数、引入灵活的无分类器指导和高效的上下文内条件作用，解决了训练稳定性和效率问题。

iMF在ImageNet测试中的表现如何？

iMF在ImageNet 256×256基准测试中取得了1.72的FID成绩，超越了多步扩散模型。

iMF是如何提升训练稳定性的？

iMF通过将训练目标转化为瞬时速度损失，避免了目标自依赖结构，从而提升了训练的稳定性。

无分类器指导（CFG）在iMF中有什么作用？

CFG允许在推理时调整指导尺度，以优化图像质量和多样性，增强了模型的灵活性。

iMF与原始MeanFlow模型相比有什么优势？

iMF在训练稳定性、指导灵活性和模型效率上都有显著提升，且在性能上优于许多快进模型。

这篇论文的共同作者有哪些？

共同作者包括清华姚班大二学生Yiyang Lu及多位知名研究员，如Adobe的Zongze Wu和CMU的Zico Kolter。

🏷️

继续阅读

智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
每家公司的首个人工智能战略都应该是技能库
企业在实施人工智能时，首要任务是建立“技能图书馆”，记录优秀员工的工作流程和经验，将其转化为可重复使用的技能，以提升AI的实用性和效率，帮助公司更好地利用人工智能。
[MAF预定义ChatClient中间件-03]CachingChatClient——利用缓存省钱省时间 - Artech
CachingChatClient是一个中间件，用于缓存LLM调用结果，减少重复调用的时间和费用。它通过检查缓存返回相同输入的响应，若不存在则调用LLM并...
从超级个体到超级团队，腾讯云发布WorkBuddy企业版
腾讯云在AI产业应用大会上发布了WorkBuddy企业版及办公智能体套件，旨在帮助企业实现AI转型。该套件提供数字员工、人机协作和团队管理功能，提升工作效...
团队在处理重复支付时面临的后台挑战
现代支付系统表面简单，但重复交易的后台复杂性显著。文章探讨了构建重复支付系统时的七个挑战，包括管理支付计划、避免重复收费、优雅处理失败支付、保持系统状态一...
The latest AI news we announced in May 2026
May AI recap