小红花·文摘

Awesome Nano Banana Pro - 一个精心策划的开源高质量提示和示例集合，用于...

云原生 ·

该研究提出了一种基于流匹配的生成模型，旨在解决实时人物图像合成中的挑战，特别是在多样化人姿态下的高保真图像合成。实验结果表明，该模型在深度时尚数据集上实现了近实时的采样速度，显著提升了实时交互系统的应用潜力。

基于流匹配模型的实时人物图像合成

BriefGPT - AI 论文速递 ·

本文介绍了一系列基于扩散模型和GAN的图像合成技术，重点在于提高采样效率、实时生成高保真图像和模型训练收敛性。研究表明新模型在多种任务中表现优越，并提供了开源代码供使用。

SwiftBrush v2：让您的单步扩散模型超越其老师

BriefGPT - AI 论文速递 ·

本文介绍了一种隐式扩散模型(IDM)用于高保真图像超分辨率，能够满足不同分辨率需求。研究提出了Diff-SR和ACDMSR等新方法，利用预训练模型和创新技术提升超分辨率效果，实验结果验证了其优越性。

基于扩散的时间感知蒸馏单步超分辨率

BriefGPT - AI 论文速递 ·

本文介绍了Imagin技术在文本到图像生成中的应用，利用大型transformer模型实现高保真图像生成。通过DrawBench基准测试，该技术在图像-文本对齐和样本质量上优于现有模型。研究提出了安全潜在扩散（SLD）方法，解决生成图像中的不当内容问题，并通过生成语义护理（GSN）和注意力机制提高图像真实性。此外，研究展示了如何通过软提示和对比引导方法增强模型的灵活性和控制能力。

Imagen 3

BriefGPT - AI 论文速递 ·

本文探讨了视频虚拟试穿技术的进展，提出了一种基于扩散模型的新解决方案，解决了服装纹理和用户身份保留的问题。研究展示了VITON-DiT和WarpDiffusion等新框架在复杂人体姿势下生成高保真虚拟试穿图像的能力，并通过创新的注意力机制和多视图方法提升了虚拟试穿的真实性和效果。

野外影像中基于图像控制扩散模型的视频虚拟试穿

BriefGPT - AI 论文速递 ·