量子位 ·

何恺明团队新作：扩散模型可能被用错了

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

何恺明团队的新论文提出扩散模型应聚焦于去噪，直接预测干净图像而非噪声。新架构JiT（Just image Transformers）设计简化，避免复杂组件，实验表明其在高维空间中表现优越，生成质量高。

🎯

关键要点

何恺明团队的新论文提出扩散模型应聚焦于去噪，直接预测干净图像而非噪声。
扩散模型的主流玩法是预测噪声，但这与其去噪的本质相悖。
流形假设认为自然图像集中在低维流形上，而噪声则均匀分布在高维空间中。
直接预测干净图像可以降低模型容量要求，更符合神经网络的设计初衷。
新架构JiT（Just image Transformers）设计简化，不依赖复杂组件和预训练特征。
JiT在高维空间中表现优越，生成质量高，且在ImageNet上达到了SOTA级FID分数。
研究团队的成员黎天鸿在表征学习和生成模型方面有深入研究。

🏷️

继续阅读

周鸿祎表示360将推出OpenClaw AI机器人一键安装包帮助用户快速部署龙虾
周鸿祎表示，360将推出一键安装版的OpenClaw AI机器人，旨在降低用户的安装门槛，使更多人能够使用AI助手。尽管龙虾概念引起关注，但当前的部署和维...
腾讯正在内测QClaw龙虾一键部署OpenClaw且支持微信渠道收发消息
腾讯正在内测QClaw龙虾，支持一键部署OpenClaw到本地并通过微信收发消息。QClaw简化了安装过程，内置多种模型供用户配置，功能包括读取文件和自动...
小白用户，我为什么劝你别急着养AI“龙虾”
【TechWeb】3月9日消息，最近你要是还没听说过“龙虾”的大名，那你可能真的out了。这里的“龙虾”，不是指麻辣小龙虾，而是指最近火爆全球的开源AI智...
卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
X/Twitter加强客户端验证导致解锁BL/未谷歌认证设备无法发帖目前已撤回封禁
社交网站X/Twitter加强客户端验证，导致许多正常用户无法通过Android/iOS客户端发帖。虽然此举旨在打击机器人，但反而影响了用户。部分用户反馈...
Cloudflare R2 对象存储白嫖指南：10G存储+免流量费，打造免费图床
Cloudflare R2 对象存储免收出口流量费，解决了图床流量盗刷问题。兼容 S3 API，提供免费额度，适合个人用户。用户可通过缓存、速率限制和防盗...

何恺明团队新作：扩散模型可能被用错了

内容提要

关键要点

标签

继续阅读