小红花·文摘

用于分类生成建模的连续增强离散扩散模型

Apple Machine Learning Research ·

将自监督表示调整为高效生成的潜在空间

Apple Machine Learning Research ·

STARFlow：扩展潜在归一化流以实现高分辨率图像合成

Apple Machine Learning Research ·

本研究综合评估了生成性人工智能在角色动画中的应用，分析了面部动画、表情渲染和图像合成等技术，指出了当前面临的挑战，并为未来研究方向提供指导。

Generative AI in Character Animation: A Comprehensive Survey of Techniques, Applications, and Future Directions

BriefGPT - AI 论文速递 ·

本研究提出了Science-T2I数据集，解决了图像合成中科学知识整合不足的问题。研发的SciScore模型显著提升了生成图像的科学性和视觉效果，评估性能接近人类水平，推动了图像合成标准的建立。

科学影像合成中的科学幻觉：Science-T2I 的解决方案

BriefGPT - AI 论文速递 ·

本文提出了一种新型生成对抗网络CKGAN，基于特征核积分概率度量框架，旨在解决模式崩溃问题。CKGAN通过自动学习特征核函数，在合成和真实图像基准测试中表现优于其他GAN，接近手动调整的最佳性能。

CKGAN: Training Generative Adversarial Networks Using Characteristic Kernel Integral Probability Metrics

BriefGPT - AI 论文速递 ·

本研究提出了一种两阶段的差分隐私图像合成框架，通过引入“中心图像”有效学习简单特征，使合成图像的保真性和实用性分别提高了33.1%和2.1%。

From Simple to Complex: A Shortcut for Building Differentially Private Image Synthesis

BriefGPT - AI 论文速递 ·

TokenBridge：弥合可视化生成中连续和离散token表示法之间的差距

实时互动网 ·

本研究结合视觉提示与差分隐私神经切线核，提升了高分辨率图像合成数据的有效性，准确率从0.644提升至0.769，为差分隐私合成数据的应用开辟新路径。

VP-NTK: Exploring the Advantages of Visual Prompts in Differentially Private Data Synthesis

BriefGPT - AI 论文速递 ·

本研究提出DPImageBench，解决了差分隐私图像合成领域评价标准不一致的问题。通过评估十一种方法，发现上游分类器的选择会高估效用评分，且低维特征添加噪声的效果优于高维特征。

DPImageBench：差分隐私图像合成的统一基准

BriefGPT - AI 论文速递 ·

本研究提出了TaylorSeer方法，以解决扩散变换器的高计算需求问题。该方法通过泰勒级数近似特征高阶导数，显著提升了图像和视频合成的效率，尤其在高加速比下实现了近乎无损的加速效果。

From Reuse to Prediction: Accelerating Diffusion Models with TaylorSeer

BriefGPT - AI 论文速递 ·

分形人工智能以比传统模型少65%的参数生成图像和音频

DEV Community ·

本研究提出MAETok方法，通过掩码建模探索扩散模型的潜在空间特性，从而提高图像合成任务的生成质量与效率。

Masked Autoencoders as Effective Tokens for Diffusion Models

BriefGPT - AI 论文速递 ·

本研究提出了一种无需调优的方法，解决物体插入和主体驱动生成中的高数据收集成本问题。通过利用无标签数据的共现现象，构建强大的配对数据集，训练高效的文本到图像扩散架构，提升物体身份保持和图像合成效果。

ObjectMate：一种针对物体插入和主体驱动生成的循环先验

BriefGPT - AI 论文速递 ·

本文介绍了多种生成模型的改进，包括Flow++、NC-VAE、DeFlow和重建生成扩散模型。研究表明，矫正流模型在高分辨率文本到图像合成中表现优越，解决了模型崩溃和图像重建问题，提升了生成质量和性能。

分析和改善修正流模型中的模型崩溃

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，将超声心动图转化为高质量的心脏MRI图像，有效解决了噪声和对比度不足的问题。经过Cycle-GAN训练后，78.9%的病例中医师更倾向于使用合成图像进行诊断。

Real-time Blind Reconstruction of Ultrasound Echocardiography to Cardiac MRI View Conversion

BriefGPT - AI 论文速递 ·

本研究提出了一种基于监督对比学习的图像合成框架，旨在解决文本到图像生成中的内模态语义对应问题。通过共享对比分支，该框架有效聚类语义相似的图像-文本对，从而提升生成质量。实验结果表明，在COCO数据集上，FID指标显著提高，验证了方法的有效性。

A Framework for Image Synthesis Based on Supervised Contrastive Learning

BriefGPT - AI 论文速递 ·

我在构建gleam.so时学到的10种高级OG图像技巧 🔍

DEV Community ·

rebuttal真的有用！这篇ICLR论文，所有审稿人都加了2分，直接跃升排名第9

机器之心 ·

本文探讨了扩散模型在高维数据生成中的应用，包括图像合成和视频生成。研究提出了一个统一框架，并结合进化算法以提高生成效率，强调了扩散模型的潜力及未来发展方向。

启发式自适应扩散模型进化策略

BriefGPT - AI 论文速递 ·