厦门阿斯加德彩虹推出的伯虎光影APP,利用实时多模态人工智能技术,结合自研构图算法与文心大模型,提供实时美学评分和专业评语,帮助用户提升摄影水平,捕捉美丽瞬间。
腾讯混元升级了AI绘画微调方法,通过Direct-Align和语义相对偏好优化(SRPO)显著提升了图像的真实感和美学评分,人工评估分数提高300%。新方法在32块H20上训练10分钟即可收敛,解决了传统模型的优化局限性,并支持在线调整奖励信号,生成图像质量显著提升。
本文介绍了Nabla-GFlowNet,一种基于生成流网络的扩散模型微调方法,旨在提升生成图像的质量和多样性。该方法在美学评分奖励函数上表现出色,避免了过拟合,显示出相较于传统方法的优势。
该研究提出TIPO框架,以解决用户提示简单导致的文本到图像生成质量差的问题。TIPO通过预抽样和细化优化提示,显著提升图像美学评分,减少损坏,强调提示工程的重要性。
本文提出了一种评估文本到图像生成模型的框架,涵盖图像质量和文本条件两部分。引入美学评分模型,自动检测低质量区域。研究探讨了概念覆盖和公平性,揭示了模型输出中的性别、种族和年龄偏见。该方法灵活,适用于其他图像生成,促进对生成模型的理解。
本研究首次探讨文本到图像生成模型与人类偏好对齐的问题,提出Diff-Instruct++方法,显示出其快速收敛和无数据对齐的潜力,实验结果表明其在美学评分及多个指标上优于其他模型。
完成下面两步后,将自动完成登录并继续当前操作。