小红花·文摘

本研究提出了一种基于强化学习的潜在扩散模型微调方法，克服了深度学习在复杂场景中的局限性，显著提升了超分辨率图像的质量。实验结果表明，在RESISC45数据集上取得了明显的改进。

ORL-LDM：离线强化学习指导的潜在扩散模型超分辨率重建

BriefGPT - AI 论文速递 ·

本研究提出了一种引导性潜在扩散模型，克服了现有交通仿真方法在物理可行性和效率方面的不足，实验结果显示其在生成对抗性和效率上优于现有方法。

Guided Latent Diffusion Model for Safety-Critical Traffic Simulation

BriefGPT - AI 论文速递 ·

本研究提出了一种T2ID-CAS方法，以解决颈部超声解剖标志检测中的类别不平衡问题。该方法结合了潜在扩散模型和分类意识采样，实验结果显示平均精确度达到88.2%，显著高于基线的66%，展现了在超声引导干预中的应用潜力。

T2ID-CAS: A Diffusion Model and Classification-Aware Sampling Approach to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种骨架感知潜在扩散模型（SALAD），旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题，从而显著提高文本与运动的对齐能力。

骨架感知潜在扩散模型用于文本驱动的运动生成与编辑

BriefGPT - AI 论文速递 ·

用基础扩散模型实现有损图像压缩 | ECCV 2024

实时互动网 ·

ImmerseDiffusion：一种生成空间音频的潜在扩散模型

Apple Machine Learning Research ·

本研究提出了一种新的Prompt-SID框架，旨在降低传统图像去噪方法的成本和时间。该框架利用潜在扩散模型生成结构表示，并结合结构注意力模块，显著提升了去噪效果，尤其在处理不同分辨率图像时展现出强大的适应能力。

Prompt-SID: A Single-Image Denoising Technique Based on Latent Diffusion Learning Structural Representation

BriefGPT - AI 论文速递 ·

DSplats：基于去噪点云的多视图扩散模型的3D生成

Apple Machine Learning Research ·

该研究提出了一种潜在扩散模型（LDM），有效生成逼真的地面运动数据，超越了现有的GAN方法，展示了在地震学深度学习中的应用潜力。

通过最小条件的扩散模型合成宽频地面运动

BriefGPT - AI 论文速递 ·

本研究提出了一种新的潜在扩散模型（CICLD），旨在通过对抗学习有效缩小合成图像与真实图像之间的差距，从而改善无监督领域自适应（UDA），并提升多个基准数据集的表现。

Adversarial Diffusion Model for Unsupervised Domain Adaptation in Semantic Segmentation

BriefGPT - AI 论文速递 ·

本研究提出了一种新的基于潜在扩散模型的框架，用于在有限数据下生成眼底荧光血管造影（FFA）图像。通过优化微调协议，提升了生成能力，成功应对不同模态和疾病类型的挑战，促进眼科诊断和患者护理。

Rethinking Diffusion-Based Synthesis of Fundus Fluorescein Angiography under Limited Data

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的全端到端口型同步框架LatentSync，基于音频条件的潜在扩散模型，旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递 ·

本研究提出了一种新的文本转语音生成方法——潜在语音（LatentSpeech），通过潜在扩散模型降低计算负担，简化编码器和声码器处理，提升生成语音质量。实验结果显示，潜在语音在词错误率和梅尔谱失真方面分别提高了25%和24%。

LatentSpeech: Text-to-Speech Generation Based on Latent Diffusion

BriefGPT - AI 论文速递 ·

流匹配加速AI图像生成并提升质量

DEV Community ·

本研究探讨了生成合成胸部X光图像的方法，以优化深度学习模型在分类和分割任务中的表现。通过潜在扩散模型和放射科医师反馈，提出了一种提升合成数据质量的新方法。实验结果表明，合成数据显著提高了模型性能，具有重要应用潜力。

评估和改善合成胸部X光片在医学影像分析中的有效性

BriefGPT - AI 论文速递 ·

本研究提出了VideoFusion、Motion Generation和MoVideo框架等视频生成方法，利用潜在扩散模型和自编码器提升视频生成的质量和效率。通过分解噪声和建模时间运动，改善了视频的时间一致性和视觉连贯性，推动了文本到视频生成技术的发展。

COMUNI：基于扩散的视频生成中常见和独特视频信号的分解

BriefGPT - AI 论文速递 ·

本研究提出了一种潜在扩散模型LDM3D，能够根据文本提示生成高质量的3D图像和深度图，适用于娱乐、游戏和设计等领域。通过改进的2D条件扩散模型，增强了用户对3D内容的交互控制。PI3D框架利用预训练模型快速生成多样化的3D形状，展示了3D生成领域的显著进展。

Phidias：基于参考增强扩散生成文本、图像和3D条件下的3D内容模型

BriefGPT - AI 论文速递 ·

本文探讨了将图像水印与潜在扩散模型结合的技术，提出了稳健隐形水印（RIW）和ProMark等新方法，以确保生成图像的版权追溯和检测。这些技术在保持图像质量的同时，能有效嵌入水印并抵御修改，提升了图像生成的安全性和责任归属。

通过水印信息融合实现潜在扩散模型的有效用户归属

BriefGPT - AI 论文速递 ·

本文介绍了多种生成3D人脸和人体图像的新方法，主要包括生成对抗网络（GAN）和潜在扩散模型。研究通过改进模型和数据集，提高了生成图像的质量和真实感，尤其在姿势和手部细节控制方面。实验结果显示，这些方法在生成准确性和图像质量上优于现有技术。

RealisHuman：用于修复生成图像中畸形人类部分的两阶段方法

BriefGPT - AI 论文速递 ·

本文介绍了一种基于深度卷积解码器的3D形状生成架构，采用八叉树表示，提升了生成分辨率并减少了内存使用。该架构适用于3D自编码器和形状生成，通过自适应八叉树卷积神经网络和潜在扩散模型，显著提高了3D形状生成的效率和质量，在物体分类和形状检索等任务中表现优越。

OctFusion：基于八叉树的扩散模型用于3D形状生成

BriefGPT - AI 论文速递 ·