BriefGPT - AI 论文速递 ·

ViPer: 个体偏好学习的生成模型视觉个性化

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本研究提出了一种无需提示的个性化图像生成方法，利用多模态大型语言模型创建用户偏好数据集，以提升文本到图像生成模型的对齐性。通过用户互动改进提示质量，增强个性化效果，应用于图像叙事生成和服装推荐等领域，展示了个性化生成的潜力。

🎯

❓

ViPer提出了一种无需提示的个性化图像生成方法，利用多模态大型语言模型创建用户偏好数据集，提升文本到图像生成模型的对齐性。

通过用户互动，ViPer能够改进提示质量，从而增强个性化效果，成功应用于人脸编辑和个性化服装推荐等任务。

ViPer使用可解释的图像特征学习过程，解释用户对特定视觉属性和风格的偏好，在个性化排名任务中实现了最先进的性能。

UniMP是一个统一的多模式个性化系统，通过使用多模态数据满足广泛的个性化需求，包括物品推荐和用户引导的图像生成。

ViPer通过利用用户与系统的历史互动，提出了一种用户提示重写方法，增强用户提示与预期视觉输出之间的对齐。

去耦合自增强策略改善个性化模型对目标属性的理解，增强可控性和灵活性，能够生成与用户指定的视觉属性相关和不相关的样本。

🏷️