小红花·文摘 - 小红花技术领袖俱乐部

研究人员试图揭示扩散模型创造力的起源

研究人员试图揭示扩散模型创造力的起源

InfoQ ·

两位物理学家研究表明，图像生成AI的“创造力”源于扩散模型的去噪过程，类似于生物细胞的自我组装。他们发现局部性和等变性机制促进了AI的创造力，使其能够生成新颖的图像，揭示了AI与人类创造力的相似性。

物理学家靠生物揭开AI创造力来源：起因竟是“技术缺陷”

量子位 ·

我在研究Step1X-Edit扩散模型，该模型通过vlm编码文字指令和图像，提供高效的图片编辑解决方案。文章详细描述了模型的执行流程，包括图像编码、降采样、噪声构建和去噪过程，旨在分享对该模型的理解和应用。

Step1X-Edit执行流程（一）

李文举 ·

ICML 2024 | 人物交互图像，现在更懂你的提示词了，北大推出基于语义感知的人物交互图像生成框架

ICML 2024 | 人物交互图像，现在更懂你的提示词了，北大推出基于语义感知的人物交互图像生成框架

机器之心 ·

该文章介绍了一种基于扩散变压器的新型对话头合成流程，利用音频驱动扩散模型的去噪过程。该方法可推广到多个身份，产生高质量的结果。与现有方法相比，该模型在视觉质量和嘴唇同步准确性方面具有竞争力。该方法在虚拟助手、娱乐和教育等领域有潜力。

DiT-Head：使用扩散变压器进行高分辨率说话人合成

BriefGPT - AI 论文速递 ·