小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

在GTC 2026上,NVIDIA推出了Physical AI概念,强调AI与现实世界的深度结合。发布了Isaac GR00T、Kimodo和SOMA-X等开源项目,旨在提升机器人在复杂环境中的执行能力,使其更自然、高效地完成任务。

在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

HyperAI超神经
HyperAI超神经 · 2026-03-25T05:49:56Z
ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

扩散模型在图像生成方面取得了重要进展,但由于推理步骤多和分辨率限制,实际应用受到制约。为提高效率和图像保真度,提出了GenDR和GenDR-Pix模型,优化了VAE和UNet,支持高分辨率图像处理,增强了细节恢复效果,推动生成技术与实际业务的结合。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

实时互动网
实时互动网 · 2026-03-04T06:39:12Z
何恺明团队再出大招:Drifting Models 挑战扩散模型,单步生成高质量图像

何恺明团队在arXiv发布了《Generative Modeling via Drifting》论文,提出了Drifting Models生成模型,训练时分布逐步漂移,推理时仅需一步生成,速度提升100倍,质量更佳,标志着生成模型领域的重要转折,期待广泛应用。

何恺明团队再出大招:Drifting Models 挑战扩散模型,单步生成高质量图像

Micropaper
Micropaper · 2026-03-03T00:30:00Z
扩散模型成最快深度思考!告别自回归每秒1009个tokens,英伟达微软都投了

扩散模型Mercury 2成为最快的生成模型,生成速度达到每秒1009个tokens,比传统自回归模型快5倍。其并行优化机制提升了生成速度,并在性能和成本上具有优势。Inception Labs专注于扩散模型,致力于突破速度与成本的瓶颈。

扩散模型成最快深度思考!告别自回归每秒1009个tokens,英伟达微软都投了

量子位
量子位 · 2026-02-26T02:03:18Z
ICLR 2026 | 把视频扩散模型压到4bit,还能接近满血效果? QVGen让「超低比特视频生成量化」真正可用

抱歉,提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

ICLR 2026 | 把视频扩散模型压到4bit,还能接近满血效果? QVGen让「超低比特视频生成量化」真正可用

机器之心
机器之心 · 2026-02-25T10:07:08Z
RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进

RISE是一个通过想象进行机器人强化学习的框架,旨在提升视觉-语言-动作模型在复杂任务中的鲁棒性。它结合动力学预测和价值估计,利用组合式世界模型生成高效学习信号,表现优于传统强化学习方法,能够有效应对动态适应性和精确性要求的任务。

RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进

结构之法 算法之道
结构之法 算法之道 · 2026-02-18T15:07:31Z
速度提升,能力却暴跌?扩散模型做智能体的残酷真相

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。

速度提升,能力却暴跌?扩散模型做智能体的残酷真相

机器之心
机器之心 · 2026-02-12T06:52:01Z

蚂蚁技术研究院推出的LLaDA2.1扩散模型在编程任务中实现892 tokens/秒的速度,标志着研究模型向实用工具的转变。其双模式设计允许用户根据需求选择速度或质量,克服了传统模型的局限性。LLaDA2.1在速度和质量上均表现优异,开源版本提供了轻量化选择。

小众架构赢麻了!通过编辑功能让100B扩散模型飙出892 tokens/秒的速度!

量子位
量子位 · 2026-02-11T02:06:53Z
基于超2万条配方,MIT等采用扩散模型规划材料合成,成功制备硅铝比高达19的新型沸石材料

DiffSyn模型通过分析23,000条文献生成材料合成路线,有效解决了合成方法的问题。在沸石合成中,该模型表现出色,成功制备出Si/Al比高达19.0的UFI型沸石,展示了其在材料研究中的应用潜力。

基于超2万条配方,MIT等采用扩散模型规划材料合成,成功制备硅铝比高达19的新型沸石材料

HyperAI超神经
HyperAI超神经 · 2026-02-09T08:19:05Z
Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更多信息或更长的文本。

Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

机器之心
机器之心 · 2026-01-14T06:41:22Z
让扩散模型「可解释」不再降质,开启图片编辑新思路

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。

让扩散模型「可解释」不再降质,开启图片编辑新思路

机器之心
机器之心 · 2025-12-16T02:45:50Z
DarkDiff:通过重新利用扩散模型推动低光环境下的原始图像增强

本文介绍了一种新框架,通过重新利用预训练的生成扩散模型来增强低光环境下的原始图像。该方法在三种低光原始图像基准测试中表现优于现有技术,能够更好地恢复图像细节和颜色,克服了传统算法的不足。

DarkDiff:通过重新利用扩散模型推动低光环境下的原始图像增强

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-16T00:00:00Z

蚂蚁集团赵俊博在MEET2026大会上介绍了扩散模型的优势,指出其可直接修改token,从而提升生成速度和降低计算成本。他们开源了LLaDA 2.0,首次实现千亿参数的扩散语言模型,引发行业关注。

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

量子位
量子位 · 2025-12-12T04:38:27Z
NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

AI短名单是对长篇文章的简要概述,旨在提炼出核心内容。

NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

机器之心
机器之心 · 2025-12-12T03:31:29Z
DiT-Air:重新审视文本到图像生成中扩散模型架构设计的效率

本文研究了扩散变换器(DiTs)在文本到图像生成中的效率,分析了架构选择和训练策略。结果表明,标准DiT在性能上与专门模型相当,但参数效率更高。通过层级参数共享策略,DiT-Air和DiT-Air-Lite在保持竞争力的同时,模型尺寸减少了66%。DiT-Air在GenEval和T2I CompBench上表现优异。

DiT-Air:重新审视文本到图像生成中扩散模型架构设计的效率

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
用于分类生成建模的连续增强离散扩散模型

本文介绍了连续增强离散扩散模型(CADD),该模型通过在连续潜在空间中增强离散状态空间,解决了传统离散扩散模型的信息缺失问题。CADD利用噪声潜在向量表示被遮蔽的标记,提升了文本生成、图像合成和代码建模的生成质量,并在多样性与上下文精确性之间实现了灵活控制。

用于分类生成建模的连续增强离散扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-10T00:00:00Z
剑桥大学研发血液细胞图像分类器,扩散模型助力白血病发现,能力超越临床专家

血液细胞影像分析对临床诊断至关重要。剑桥大学研究团队提出的CytoDiffusion模型基于扩散模型,能够精准分类血细胞,具备异常检测能力和高数据效率。该模型在多个评估指标上优于传统方法,展示了扩散模型在医学影像分析中的潜力,未来有望提升临床诊断准确性。

剑桥大学研发血液细胞图像分类器,扩散模型助力白血病发现,能力超越临床专家

HyperAI超神经
HyperAI超神经 · 2025-11-27T06:45:50Z

LDM(潜在扩散模型)仍然是主流,但高倍压缩导致信息损失。新方法JiT直接预测原始数据,简化模型架构,提升高分辨率生成效果。尽管JiT未显著超越现有SOTA,但降低了计算成本,增强了模型的可迁移性和统一性。

生成扩散模型漫谈(三十一):预测数据而非噪声

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-11-24T09:31:00Z

何恺明团队的新论文提出扩散模型应聚焦于去噪,直接预测干净图像而非噪声。新架构JiT(Just image Transformers)设计简化,避免复杂组件,实验表明其在高维空间中表现优越,生成质量高。

何恺明团队新作:扩散模型可能被用错了

量子位
量子位 · 2025-11-20T02:02:27Z
为什么扩散模型可能会改变开发者的工作流程(2026年)

开发者在编写代码时需要频繁编辑和调试,非线性生成代码。扩散大语言模型(d-LLMs)通过同时考虑过去和未来的上下文,更有效地模拟这种迭代过程。与自回归模型相比,d-LLMs能更灵活地处理局部修改和全局一致性,适合代码重构和上下文编辑。尽管存在一些局限性,但它们在代码生成和编辑方面展现出新的可能性。

为什么扩散模型可能会改变开发者的工作流程(2026年)

The JetBrains Blog
The JetBrains Blog · 2025-11-17T07:23:13Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码