小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
条件扩散中的组合泛化的局部机制

本文探讨了条件扩散模型的组合泛化能力,特别是长度泛化,即生成训练中未见过的对象图像。在CLEVR实验中,发现长度泛化在某些情况下可行,表明模型能够学习组合结构。研究表明,局部条件分数与组合泛化相关,成功的模型展现出局部条件分数,而失败的模型则没有。通过因果干预,可以在之前失败的模型中实现长度泛化。

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-28T00:00:00Z
哥大/斯坦福联手!Squidiff实现多场景转录组模拟,助力精准医学与空间医学发展

Squidiff是一个基于条件扩散模型的计算框架,能够精准预测细胞在分化、基因扰动和药物处理下的转录组响应。研究表明,该模型有效捕捉细胞状态变化,提升了细胞生物学研究的预测能力,推动精准医疗和再生医学的发展。

哥大/斯坦福联手!Squidiff实现多场景转录组模拟,助力精准医学与空间医学发展

HyperAI超神经
HyperAI超神经 · 2025-11-10T06:08:20Z
条件扩散中的组合泛化的局部机制

本文探讨了条件扩散模型的组合泛化能力,特别是长度泛化,即生成比训练时更多物体的图像。研究发现,模型在某些情况下能够实现长度泛化,表明它们有时学习到组合结构。成功的CLEVR模型展示了局部条件分数,而失败的模型则没有。强制局部条件分数的干预可以恢复失败模型的长度泛化能力。

条件扩散中的组合泛化的局部机制

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-09T00:00:00Z

本文介绍了一种名为ConDiSim的条件扩散模型,旨在解决复杂系统的基于仿真的推断问题,尤其是处理不可处理似然性的情况。该模型通过学习去噪过程,有效捕捉后验分布中的复杂依赖关系和多模态性。研究表明,ConDiSim在多个基准问题和真实世界测试中表现优异,适用于快速推断的参数推断工作流。

ConDiSim:用于基于仿真的推断的条件扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种DenseFormer方法,通过条件扩散模型从稀疏深度图和RGB图像生成密集深度图,显著提高了深度图预测的精度,超越了传统的深度补全方法。

DenseFormer: Learning Dense Depth Maps from Sparse Depth and Images via Conditional Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了一种高效的快速适应方法,解决自动化决策系统中的轨迹个性化问题。通过利用预训练的条件扩散模型和偏好潜在嵌入,显著优于现有技术,提供了更具代表性的基准实验。

扩散规划中人类偏好对齐的潜在嵌入适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本研究提出GDiffRetro方法,解决了逆合成预测中的反应中心识别和反应物生成问题。通过结合原始图和双图,GDiffRetro能够更有效地捕捉分子信息,并利用条件扩散模型生成反应物。实验结果表明,该方法在评估指标上优于现有模型,具有重要的应用潜力。

GDiffRetro:双图增强分子表征与扩散生成的逆合成预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z
闪电扩散使AI图像生成速度提升10倍,质量保持不变

本文介绍了一种新方法“闪电扩散”,该方法能在保持条件扩散模型性能的同时,显著加快图像生成速度,生成高质量图像所需步骤减少,速度提升达十倍。

闪电扩散使AI图像生成速度提升10倍,质量保持不变

DEV Community
DEV Community · 2024-12-19T07:55:19Z
Kaleido扩散:通过自回归潜在建模改善条件扩散模型

Kaleido是一种新方法,通过引入自回归潜在先验,增强条件扩散模型的样本多样性。它结合自回归语言模型生成潜在变量,丰富输入条件,提高生成图像的多样性和质量。实验结果表明,Kaleido有效扩展了基于文本描述生成的图像样本的多样性,同时保持高质量。

Kaleido扩散:通过自回归潜在建模改善条件扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2024-12-02T00:00:00Z

本研究提出了一种从文本生成楼层平面图的方法,采用链式思维引导大型语言模型生成初步布局,并利用条件扩散模型进行细化。实验结果表明,该方法在各项指标上表现优异,具有重要的实际应用潜力。

HouseLLM:大语言模型辅助的双阶段文本到楼层平面图生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本文研究了一种基于物理学原理的深度学习图像形成模型,旨在改善肖像摄影中的光照效果。该模型通过去除光线干扰和校正漏光,在复杂光照条件下生成真实的照明效果。此外,研究提出了利用条件扩散模型进行人脸重照明的方法,展示了在多视图数据中实现高质量光照控制的潜力,推动了计算机视觉和图形学的发展。

DifFRelight:基于扩散的面部表现重新照明

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文提出了一种基于条件扩散模型的统一框架,用于图像到图像的转换,包括上色、修复、裁剪和JPEG恢复等任务。该框架在多个任务中超越了现有基线,且无需特定调整。研究强调自我关注的重要性,并倡导统一评估协议,以推动图像翻译研究。通过引入新型去噪扩散模型和交叉注意力层,提升了图像生成和编辑的性能,展示了扩散模型在图像处理中的潜力。

基于扩散的图像到图像转换的噪声校正方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本文研究了条件扩散模型在文本到图像和文本到语音合成任务中的表现。结果显示,文本到语音模型对输入文本不敏感,而文本到图像模型表现力更强,但无法有效区分混淆提示。这些发现揭示了条件扩散模型在处理输入时的非敏感性,提供了新的视角。

条件模型下扩散模型似然性变化的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本文介绍了多种新视角合成方法,如GVS、ViewNeTI和Light Field Diffusion,利用条件扩散模型和三维感知技术,提高了图像生成的质量和效率。研究表明在不同数据集上表现优越,并提出了新颖的相机参数化方案,以解决深度尺度的二义性问题。

基于预训练扩散引导的单图像新视角合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文介绍了一种名为ProGen的渐进式零样本数据集生成框架,该框架利用任务特定模型反馈生成训练数据,实验结果显示其在文本分类任务中表现优异。此外,提出了多种图像生成方法,包括ProSpect和基于类原型的条件扩散模型CPDM,旨在提升图像质量和生成灵活性,并解决灾难性遗忘问题。研究还探讨了图像合成和多属性优化技术,显著提升了生成质量和灵活性。

激发能量扩散的创造生成过程,不要复制生产

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

本文介绍了多种新型模型反演攻击方法,包括基于条件扩散模型的MIA、Inversion-specific GAN和CG-MI等。这些方法在黑盒环境中有效恢复目标样本,提高攻击成功率,并在隐私保护方面提供实用解决方案。实验结果表明,这些方法在生成高质量图像和保护成员隐私方面具有显著优势。

通过目标特定条件扩散模型的模型倒置攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本文介绍了一种基于文本的运动合成技术,利用DiffKFC建立条件扩散模型,结合关键帧和扩张掩码注意力模块,实现高效的运动生成。该模型在多个数据集上表现优异,能够生成复杂的人类运动,并在动态排版和视频编辑中展现良好效果。

动态排版扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

本文介绍了多种高光谱图像超分辨率方法,包括无监督编码器-解码器架构、条件扩散模型和混合卷积双域网络。这些方法通过融合低分辨率和高分辨率图像,利用自我注意力机制和多任务学习等技术,显著提升了图像的空间和光谱质量,实验结果显示其性能优于现有技术。

UnmixingSR:面向高光谱图像超分辨率的材料感知网络与无监督分解辅助任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

DreamHuman 是一种自动生成三维人物头像模型的方法,结合文本到图像合成、神经辐射场和统计人体模型,生成高质量的动态三维头像。通过改进的 2D 条件扩散模型,增强用户对三维内容的控制,解决几何不一致性问题。DreamView 和其他框架如 DreamAvatar 进一步提升了三维生成的个性化和一致性,推动了创意应用的发展。

YouDream: 生成可解剖控制的一致性文本到三维动物

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文提出了一种新框架,能够同时去除肖像图像中的眼镜及其阴影,利用合成数据集和深度学习技术显著提升识别性能。此外,研究还介绍了基于条件扩散模型的视频编辑方法,确保编辑信息在视频帧中一致,展示了优越的编辑能力和视觉质量。

V-LASIK: 使用合成数据从视频中彻底去除眼镜

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码