小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

扩散模型在图像生成方面取得了重要进展,但由于推理步骤多和分辨率限制,实际应用受到制约。为提高效率和图像保真度,提出了GenDR和GenDR-Pix模型,优化了VAE和UNet,支持高分辨率图像处理,增强了细节恢复效果,推动生成技术与实际业务的结合。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

实时互动网
实时互动网 · 2026-03-04T06:39:12Z
何恺明团队再出大招:Drifting Models 挑战扩散模型,单步生成高质量图像

何恺明团队在arXiv发布了《Generative Modeling via Drifting》论文,提出了Drifting Models生成模型,训练时分布逐步漂移,推理时仅需一步生成,速度提升100倍,质量更佳,标志着生成模型领域的重要转折,期待广泛应用。

何恺明团队再出大招:Drifting Models 挑战扩散模型,单步生成高质量图像

Micropaper
Micropaper · 2026-03-03T00:30:00Z
扩散模型成最快深度思考!告别自回归每秒1009个tokens,英伟达微软都投了

扩散模型Mercury 2成为最快的生成模型,生成速度达到每秒1009个tokens,比传统自回归模型快5倍。其并行优化机制提升了生成速度,并在性能和成本上具有优势。Inception Labs专注于扩散模型,致力于突破速度与成本的瓶颈。

扩散模型成最快深度思考!告别自回归每秒1009个tokens,英伟达微软都投了

量子位
量子位 · 2026-02-26T02:03:18Z

摘要:...

RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进

结构之法 算法之道
结构之法 算法之道 · 2026-02-18T15:07:31Z

速度提升,能力却暴跌?扩散模型做智能体的残酷真相

机器之心
机器之心 · 2026-02-12T06:52:01Z

蚂蚁技术研究院推出的LLaDA2.1扩散模型在编程任务中实现892 tokens/秒的速度,标志着研究模型向实用工具的转变。其双模式设计允许用户根据需求选择速度或质量,克服了传统模型的局限性。LLaDA2.1在速度和质量上均表现优异,开源版本提供了轻量化选择。

小众架构赢麻了!通过编辑功能让100B扩散模型飙出892 tokens/秒的速度!

量子位
量子位 · 2026-02-11T02:06:53Z

麻省理工学院、德国慕尼黑工业大学和西班牙瓦伦西亚理工大学的研究团队创新地提出了 DiffSyn —— 一种基于超 50 年时间跨度文献中 23,000 余条生成配方训练得到的生成式扩散模型。

基于超2万条配方,MIT等采用扩散模型规划材料合成,成功制备硅铝比高达19的新型沸石材料

HyperAI超神经
HyperAI超神经 · 2026-02-09T08:19:05Z

Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

机器之心
机器之心 · 2026-01-14T06:41:22Z

让扩散模型「可解释」不再降质,开启图片编辑新思路

机器之心
机器之心 · 2025-12-16T02:45:50Z
DarkDiff:通过重任务生成扩散模型提升低光原始图像质量

在极低光照条件下,高质量摄影对数码相机构成挑战。传统图像处理算法逐渐被深度网络取代,但现有模型常导致低光照片过度平滑。我们提出了一种新框架,利用重任务预训练的生成扩散模型增强低光原始图像,实验结果表明该方法在感知质量上优于现有技术。

DarkDiff:通过重任务生成扩散模型提升低光原始图像质量

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-16T00:00:00Z

蚂蚁集团赵俊博在MEET2026大会上介绍了扩散模型的优势,指出其可直接修改token,从而提升生成速度和降低计算成本。他们开源了LLaDA 2.0,首次实现千亿参数的扩散语言模型,引发行业关注。

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

量子位
量子位 · 2025-12-12T04:38:27Z

NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

机器之心
机器之心 · 2025-12-12T03:31:29Z
DiT-Air:重新审视文本到图像生成中扩散模型架构设计的效率

本研究探讨了扩散变换器(DiTs)在文本到图像生成中的应用,比较了多种架构和训练策略。结果表明,标准DiT在参数效率上优于专门模型,同时DiT-Air和DiT-Air-Lite在性能上也表现出色。

DiT-Air:重新审视文本到图像生成中扩散模型架构设计的效率

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
用于分类生成建模的连续增强离散扩散模型

标准离散扩散模型将未观察状态映射到吸收标记,导致信息丢失。我们提出了连续增强离散扩散(CADD)框架,通过在连续潜在空间中配对扩散,增强离散状态空间。CADD在每个反向步骤中利用连续潜在向量作为语义提示,提升生成质量,适用于文本生成、图像合成和代码建模。

用于分类生成建模的连续增强离散扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-10T00:00:00Z

来自英国剑桥大学的研究团队提出了 CytoDiffusion——一种基于扩散模型的血液细胞图像分类方法。它能够忠实建模血细胞形态分布,实现精准分类,同时具备强大的异常检测能力、对分布偏移的抵抗力、可解释性、高数据效率,以及超越临床专家的不确定性量化能力。

剑桥大学研发血液细胞图像分类器,扩散模型助力白血病发现,能力超越临床专家

HyperAI超神经
HyperAI超神经 · 2025-11-27T06:45:50Z

LDM(潜在扩散模型)仍然是主流,但高倍压缩导致信息损失。新方法JiT直接预测原始数据,简化模型架构,提升高分辨率生成效果。尽管JiT未显著超越现有SOTA,但降低了计算成本,增强了模型的可迁移性和统一性。

生成扩散模型漫谈(三十一):预测数据而非噪声

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-11-24T09:31:00Z

何恺明团队的新论文提出扩散模型应聚焦于去噪,直接预测干净图像而非噪声。新架构JiT(Just image Transformers)设计简化,避免复杂组件,实验表明其在高维空间中表现优越,生成质量高。

何恺明团队新作:扩散模型可能被用错了

量子位
量子位 · 2025-11-20T02:02:27Z
为什么扩散模型可能会改变开发者的工作流程(2026年)

开发者在编写代码时需要频繁编辑和调试,非线性生成代码。扩散大语言模型(d-LLMs)通过同时考虑过去和未来的上下文,更有效地模拟这种迭代过程。与自回归模型相比,d-LLMs能更灵活地处理局部修改和全局一致性,适合代码重构和上下文编辑。尽管存在一些局限性,但它们在代码生成和编辑方面展现出新的可能性。

为什么扩散模型可能会改变开发者的工作流程(2026年)

The JetBrains Blog
The JetBrains Blog · 2025-11-17T07:23:13Z

清华与快手团队推出的SVG模型在训练效率上提升6200%,生成速度提升3500%。该模型通过构建语义与细节融合的特征空间,解决了VAE的语义纠缠问题,支持多任务通用,生成质量和效率显著优于传统方法。

VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%

量子位
量子位 · 2025-10-28T07:35:11Z

麻省理工学院李明达教授团队等提出 SCIGEN 几何结构约束集成方法,可适配任意预训练生成式扩散模型,用以整合对称性和几何图案约束,从而生成含特殊限定的目标材料。

定向设计目标稳定材料,麻省理工学院开发SCIGEN,可适配任意预训练扩散模型

HyperAI超神经
HyperAI超神经 · 2025-10-09T06:06:27Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码