小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于强化学习的潜在扩散模型微调方法,克服了深度学习在复杂场景中的局限性,显著提升了超分辨率图像的质量。实验结果表明,在RESISC45数据集上取得了明显的改进。

ORL-LDM:离线强化学习指导的潜在扩散模型超分辨率重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了一种引导性潜在扩散模型,克服了现有交通仿真方法在物理可行性和效率方面的不足,实验结果显示其在生成对抗性和效率上优于现有方法。

Guided Latent Diffusion Model for Safety-Critical Traffic Simulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了一种T2ID-CAS方法,以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样,实验结果显示平均精确度达到88.2%,显著高于基线的66%,展现了在超声引导干预中的应用潜力。

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一种骨架感知潜在扩散模型(SALAD),旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题,从而显著提高文本与运动的对齐能力。

骨架感知潜在扩散模型用于文本驱动的运动生成与编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
用基础扩散模型实现有损图像压缩 | ECCV 2024

本文提出了一种新型有损图像压缩编解码器,利用潜在扩散模型在低比特率下生成高质量图像重建。该方法通过结合去噪和量化噪声,优化去噪步骤,显著提升了重建质量和速度,优于传统生成式编解码器。

用基础扩散模型实现有损图像压缩 | ECCV 2024

实时互动网
实时互动网 · 2025-02-12T06:20:36Z
ImmerseDiffusion:一种生成空间音频的潜在扩散模型

ImmerseDiffusion是一种生成音频模型,能够根据声音对象的空间、时间和环境条件生成3D沉浸式音景。该模型生成四通道的第一阶音频,结合空间音频编解码器和潜在扩散模型,支持文本提示和声学参数输入。评估结果表明,该模型在音频质量和空间一致性方面表现良好。

ImmerseDiffusion:一种生成空间音频的潜在扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-12T00:00:00Z

本研究提出了一种新的Prompt-SID框架,旨在降低传统图像去噪方法的成本和时间。该框架利用潜在扩散模型生成结构表示,并结合结构注意力模块,显著提升了去噪效果,尤其在处理不同分辨率图像时展现出强大的适应能力。

Prompt-SID: A Single-Image Denoising Technique Based on Latent Diffusion Learning Structural Representation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z
DSplats:基于去噪点云的多视图扩散模型的3D生成

DSplats是一种新方法,通过高斯点云重建器直接去噪多视图图像,生成多样化的逼真3D资产。它结合了预训练的潜在扩散模型,确保几何一致性,实验结果表明其在单图像到3D重建方面设立了新标准。

DSplats:基于去噪点云的多视图扩散模型的3D生成

Apple Machine Learning Research
Apple Machine Learning Research · 2025-01-18T00:00:00Z

该研究提出了一种潜在扩散模型(LDM),有效生成逼真的地面运动数据,超越了现有的GAN方法,展示了在地震学深度学习中的应用潜力。

通过最小条件的扩散模型合成宽频地面运动

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出了一种新的潜在扩散模型(CICLD),旨在通过对抗学习有效缩小合成图像与真实图像之间的差距,从而改善无监督领域自适应(UDA),并提升多个基准数据集的表现。

Adversarial Diffusion Model for Unsupervised Domain Adaptation in Semantic Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-22T00:00:00Z

本研究提出了一种新的基于潜在扩散模型的框架,用于在有限数据下生成眼底荧光血管造影(FFA)图像。通过优化微调协议,提升了生成能力,成功应对不同模态和疾病类型的挑战,促进眼科诊断和患者护理。

Rethinking Diffusion-Based Synthesis of Fundus Fluorescein Angiography under Limited Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种新颖的全端到端口型同步框架LatentSync,基于音频条件的潜在扩散模型,旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新的文本转语音生成方法——潜在语音(LatentSpeech),通过潜在扩散模型降低计算负担,简化编码器和声码器处理,提升生成语音质量。实验结果显示,潜在语音在词错误率和梅尔谱失真方面分别提高了25%和24%。

LatentSpeech: Text-to-Speech Generation Based on Latent Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
流匹配加速AI图像生成并提升质量

该研究探讨了流匹配如何加速AI图像生成并提升质量。通过将流匹配与潜在扩散模型结合,减少训练时间并保持高质量输出,引入新高斯假设以提高计算效率,实现更快收敛,并在图像生成基准上展现更佳样本质量。

流匹配加速AI图像生成并提升质量

DEV Community
DEV Community · 2024-12-05T10:06:33Z

本研究探讨了生成合成胸部X光图像的方法,以优化深度学习模型在分类和分割任务中的表现。通过潜在扩散模型和放射科医师反馈,提出了一种提升合成数据质量的新方法。实验结果表明,合成数据显著提高了模型性能,具有重要应用潜力。

评估和改善合成胸部X光片在医学影像分析中的有效性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了VideoFusion、Motion Generation和MoVideo框架等视频生成方法,利用潜在扩散模型和自编码器提升视频生成的质量和效率。通过分解噪声和建模时间运动,改善了视频的时间一致性和视觉连贯性,推动了文本到视频生成技术的发展。

COMUNI:基于扩散的视频生成中常见和独特视频信号的分解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本研究提出了一种潜在扩散模型LDM3D,能够根据文本提示生成高质量的3D图像和深度图,适用于娱乐、游戏和设计等领域。通过改进的2D条件扩散模型,增强了用户对3D内容的交互控制。PI3D框架利用预训练模型快速生成多样化的3D形状,展示了3D生成领域的显著进展。

Phidias:基于参考增强扩散生成文本、图像和3D条件下的3D内容模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本文探讨了将图像水印与潜在扩散模型结合的技术,提出了稳健隐形水印(RIW)和ProMark等新方法,以确保生成图像的版权追溯和检测。这些技术在保持图像质量的同时,能有效嵌入水印并抵御修改,提升了图像生成的安全性和责任归属。

通过水印信息融合实现潜在扩散模型的有效用户归属

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本文介绍了多种生成3D人脸和人体图像的新方法,主要包括生成对抗网络(GAN)和潜在扩散模型。研究通过改进模型和数据集,提高了生成图像的质量和真实感,尤其在姿势和手部细节控制方面。实验结果显示,这些方法在生成准确性和图像质量上优于现有技术。

RealisHuman:用于修复生成图像中畸形人类部分的两阶段方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

本文介绍了一种基于深度卷积解码器的3D形状生成架构,采用八叉树表示,提升了生成分辨率并减少了内存使用。该架构适用于3D自编码器和形状生成,通过自适应八叉树卷积神经网络和潜在扩散模型,显著提高了3D形状生成的效率和质量,在物体分类和形状检索等任务中表现优越。

OctFusion:基于八叉树的扩散模型用于3D形状生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码