小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于强化学习的潜在扩散模型微调方法,克服了深度学习在复杂场景中的局限性,显著提升了超分辨率图像的质量。实验结果表明,在RESISC45数据集上取得了明显的改进。

ORL-LDM:离线强化学习指导的潜在扩散模型超分辨率重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了一种引导性潜在扩散模型,克服了现有交通仿真方法在物理可行性和效率方面的不足,实验结果显示其在生成对抗性和效率上优于现有方法。

Guided Latent Diffusion Model for Safety-Critical Traffic Simulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了一种T2ID-CAS方法,以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样,实验结果显示平均精确度达到88.2%,显著高于基线的66%,展现了在超声引导干预中的应用潜力。

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一种骨架感知潜在扩散模型(SALAD),旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题,从而显著提高文本与运动的对齐能力。

骨架感知潜在扩散模型用于文本驱动的运动生成与编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
用基础扩散模型实现有损图像压缩 | ECCV 2024

本文提出了一种新型有损图像压缩编解码器,利用潜在扩散模型在低比特率下生成高质量图像重建。该方法通过结合去噪和量化噪声,优化去噪步骤,显著提升了重建质量和速度,优于传统生成式编解码器。

用基础扩散模型实现有损图像压缩 | ECCV 2024

实时互动网
实时互动网 · 2025-02-12T06:20:36Z
ImmerseDiffusion:一种生成空间音频的潜在扩散模型

ImmerseDiffusion是一种生成音频模型,能够根据声音对象的空间、时间和环境条件生成3D沉浸式音景。该模型生成四通道的第一阶音频,结合空间音频编解码器和潜在扩散模型,支持文本提示和声学参数输入。评估结果表明,该模型在音频质量和空间一致性方面表现良好。

ImmerseDiffusion:一种生成空间音频的潜在扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-12T00:00:00Z

本研究提出了一种新的Prompt-SID框架,旨在降低传统图像去噪方法的成本和时间。该框架利用潜在扩散模型生成结构表示,并结合结构注意力模块,显著提升了去噪效果,尤其在处理不同分辨率图像时展现出强大的适应能力。

Prompt-SID: A Single-Image Denoising Technique Based on Latent Diffusion Learning Structural Representation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z
DSplats:基于去噪点云的多视图扩散模型的3D生成

DSplats是一种新方法,通过高斯点云重建器直接去噪多视图图像,生成多样化的逼真3D资产。它结合了预训练的潜在扩散模型,确保几何一致性,实验结果表明其在单图像到3D重建方面设立了新标准。

DSplats:基于去噪点云的多视图扩散模型的3D生成

Apple Machine Learning Research
Apple Machine Learning Research · 2025-01-18T00:00:00Z

该研究提出了一种潜在扩散模型(LDM),有效生成逼真的地面运动数据,超越了现有的GAN方法,展示了在地震学深度学习中的应用潜力。

通过最小条件的扩散模型合成宽频地面运动

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出了一种新的潜在扩散模型(CICLD),旨在通过对抗学习有效缩小合成图像与真实图像之间的差距,从而改善无监督领域自适应(UDA),并提升多个基准数据集的表现。

Adversarial Diffusion Model for Unsupervised Domain Adaptation in Semantic Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-22T00:00:00Z

本研究提出了一种新的基于潜在扩散模型的框架,用于在有限数据下生成眼底荧光血管造影(FFA)图像。通过优化微调协议,提升了生成能力,成功应对不同模态和疾病类型的挑战,促进眼科诊断和患者护理。

Rethinking Diffusion-Based Synthesis of Fundus Fluorescein Angiography under Limited Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种新颖的全端到端口型同步框架LatentSync,基于音频条件的潜在扩散模型,旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新的文本转语音生成方法——潜在语音(LatentSpeech),通过潜在扩散模型降低计算负担,简化编码器和声码器处理,提升生成语音质量。实验结果显示,潜在语音在词错误率和梅尔谱失真方面分别提高了25%和24%。

LatentSpeech: Text-to-Speech Generation Based on Latent Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
流匹配加速AI图像生成并提升质量

该研究探讨了流匹配如何加速AI图像生成并提升质量。通过将流匹配与潜在扩散模型结合,减少训练时间并保持高质量输出,引入新高斯假设以提高计算效率,实现更快收敛,并在图像生成基准上展现更佳样本质量。

流匹配加速AI图像生成并提升质量

DEV Community
DEV Community · 2024-12-05T10:06:33Z

本研究探讨了生成合成胸部X光图像的方法,以优化深度学习模型在分类和分割任务中的表现。通过潜在扩散模型和放射科医师反馈,提出了一种提升合成数据质量的新方法。实验结果表明,合成数据显著提高了模型性能,具有重要应用潜力。

评估和改善合成胸部X光片在医学影像分析中的有效性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

潜在扩散模型在医学图像合成中应用广泛,但存在患者数据记忆化问题,可能导致隐私泄露。研究显示,CT、MRI和X射线数据集中分别有41.7%、19.6%和32.6%的记忆化现象。增加训练数据和数据增强可减少记忆化,而过度训练则会加剧。建议在开放数据共享前评估合成数据的记忆化影响。

利用再识别揭示视频扩散模型中的隐含子空间

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本研究提出DDL-CXR方法,解决临床数据时间非同步问题,通过潜在扩散模型生成个性化胸部X光图,显著提升预测性能和多模态数据融合的准确性与实用性。

通过个性化胸部X光生成解决临床多模态融合的非同步问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

医学图像生成的潜在扩散模型在隐私保护数据共享中应用广泛,但存在患者数据记忆化问题。研究显示,CT、MRI和X射线数据集中分别有41.7%、19.6%和32.6%的记忆化现象。增加训练数据和数据增强可减少记忆化,而过度训练则会加剧。建议在共享数据前评估合成数据的记忆化影响。

利用合成图像协变量和纵向数据评估预测模型的框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

该研究介绍了一种新的生成性流程,利用潜在扩散模型改变时尚设计过程,生成高质量图像。结果显示,该模型在时尚输出方面优于传统模型,展示了扩散模型在时尚设计中的潜力。研究为时尚设计和表达领域提供了互动性、个性化和技术丰富的方法。

Prompt2Fashion:一种自动生成的时尚数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本文介绍了一种新颖的可控制系统,用于生成与任意输入音轨相匹配的单音轨。该系统使用音频自编码器压缩音频波形样本,并通过潜在扩散模型生成对应音轨的潜在编码。实验证明,该系统能够生成用户指定音色的低音线,对音乐制作有重要帮助。

基于潜在扩散的多源音乐生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码