量子位 ·

腾讯混元升级AI绘画微调范式，在整个扩散轨迹上优化，人工评估分数提升300%

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

腾讯混元升级了AI绘画微调方法，通过Direct-Align和语义相对偏好优化（SRPO）显著提升了图像的真实感和美学评分，人工评估分数提高300%。新方法在32块H20上训练10分钟即可收敛，解决了传统模型的优化局限性，并支持在线调整奖励信号，生成图像质量显著提升。

🎯

关键要点

腾讯混元升级AI绘画微调方法，人工评估分数提高300%。
新方法在32块H20上训练10分钟即可收敛，解决传统模型优化局限性。
Direct-Align方法通过预先注入噪声，避免了只在后期步骤优化的局限。
语义相对偏好优化（SRPO）将奖励变为文本控制信号，支持在线调整。
SRPO通过添加控制短语实现多种风格调整，提升图像真实感和美学质量。
实验结果显示，SRPO在多个评估指标上优于ReFL、DRaFT等方法。
经过SRPO训练的FLUX模型在真实感和美学质量上显著提升。
SRPO生成的图像在保持高美学质量的同时，纹理细节更加自然真实。

🏷️

继续阅读

部署步骤现在快了15%
Vercel的构建速度平均提高1.2秒，复杂项目可提升至3.7秒，改进源于优化凭证配置，消除构建延迟。
OpenAI GPT-5.4发布，AI迎来就业报告，Anthropic在美国禁令后激增
Anthropic的新研究提出了“观察到的曝光”指标，结合理论LLM能力与实际使用数据。结果显示，AI尚未达到理论能力，实际任务覆盖率远低于可行范围。程序...
AI 时代的人类处境：科技、宗教与生命意义的重构
在AI时代，科技与宗教的关系需重新审视。科技改变人与世界的互动，但无法消解人类对意义和死亡的思考。宗教应超越消费，关注真实修行。科学与宗教的关系可视为对立...
央视点赞千问APP，“AI办事”让人工智能走进日常生活
央视点赞千问APP，推动AI办事进入日常生活。该APP通过语音交互满足个性化需求，受到大众，尤其是老年群体的欢迎。春节期间，1.3亿人体验AI下单，显示中...
OpenClaw 接入 QQ 机器人：腾讯官方入口，1 分钟扫码即用（详细教程）
腾讯开放了QQ机器人功能，用户可通过扫码快速接入，最多可创建5个机器人。创建过程简单，支持独立聊天和工具调用，QQ机器人有望成为OpenClaw的主要入口。
一分钟读论文：《生成式AI重构软件工程，开发者生产力提升55.8%》
软件开发范式正经历变革，从 Software 1.0 和 2.0 迈向 Software 3.0。自然语言将成为编程接口，AI 模型将负责实现，开发者需专...

腾讯混元升级AI绘画微调范式，在整个扩散轨迹上优化，人工评估分数提升300%

内容提要

关键要点

标签

继续阅读