结构之法算法之道 ·

文生图的最新进展：从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning

💡 原文中文，约5000字，阅读约需12分钟。

📝

内容提要

OpenAI的首个视频生成模型sora引发了对文生图和文生视频的热情。清华大学团队推出了Latent Consistency Models (LCM)，通过解决潜在空间中的概率流ODE，实现了快速的一步生成。LCM-LoRA是LCM的一种快速、无需训练的推理方法。Stable Diffusion XL Turbo是一种新一代图像合成模型，能够实时响应并生成图像。SDXL使用对抗扩散蒸馏技术，在1-4步内高效采样大规模基础图像扩散模型。

🎯

关键要点

OpenAI的首个视频生成模型sora激发了对文生图和文生视频的热情。
清华大学推出了潜一致性模型(LCM)，通过解决潜在空间中的概率流ODE实现快速生成。
LCM-LoRA是一种快速、无需训练的推理方法，可以在自定义数据集上实现快速推理。
LCM模型的生成速度比传统扩散模型快5-10倍，推动了实时生成式AI的发展。
Stable Diffusion XL Turbo是新一代图像合成模型，能够实时响应并生成图像。
SDXL Turbo在A100上可在207毫秒内生成512x512图像，标志着文生图进入实时时代。
SDXL采用对抗扩散蒸馏技术，能够在1-4步内高效采样并保持高图像质量。
对抗损失和蒸馏损失的结合使得SDXL在低步数下仍能保持高图像保真度。
LCM与其他模型相比，生成速度快、训练难度低，并兼容多种SD大模型和插件。

🏷️

继续阅读

OpenAI宣布收购AI安全初创公司Promptfoo 可以提高智能体的安全防御能力
#人工智能 OpenAI 宣布收购 AI 安全初创公司 Promptfoo，后者的技术将被用于提升 AI 智能体的安全性。Promptfoo 成立于 20...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
Google Stax：根据您自己的标准测试模型和提示
Google的Stax工具允许个人创建和评估机器学习模型，通常与TensorFlow或Vertex AI协作，专注于模型性能评估。
龙虾最大痛点被官方插件升级！对话永不忘记，GPT和Gemini最强模型都可接入
龙虾发布了OpenClaw测试版，新增上下文管理插件，增强对话记忆能力，支持多种上下文策略，解决长对话中的信息丢失问题。lossless-claw插件可持...
龙虾最佳适配模型，OpenClaw之父给出了推荐
PinchBench榜单显示，中国模型在成功率和速度上表现优异，特别是MiniMax M2.5超越其他模型。尽管价格较高，该榜单为模型选择提供了明确参考。...
提高人工智能模型解释其预测能力
麻省理工学院研究人员开发了一种新方法，利用深度学习模型提取概念，以提高计算机视觉模型的准确性和可解释性。该方法通过限制使用的概念数量，确保选择最相关的概念...

文生图的最新进展：从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning

内容提要

关键要点

标签

继续阅读