小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了HRS-Bench,一个全面的文本到图像模型评估基准,涵盖13种技能和50种情境,旨在推动文本到图像生成研究。研究发现现有模型在生成对象数量、视觉文本和情感方面存在问题,并提出了新的个性化图像生成模型Subject-Diffusion,能够在不微调的情况下生成个性化图像。通过用户反馈和新框架的应用,研究提升了图像生成的质量和准确性。

MoLE:通过低秩专家组合增强以人为中心的文本到图像扩散

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文介绍了多种文本到图像个性化生成方法,如InstantBooth、Perfusion和AttnDreamBooth。这些方法通过优化嵌入空间和注意力机制,提高了生成图像的质量与速度,解决了身份保护与文本对齐的矛盾,为个性化图像生成提供了新思路。

TextBoost: 通过微调文本编码器实现一次性个性化的文本到图像模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本研究提出了多个图像生成和编辑模型,包括PhD框架和Subject-Diffusion模型,结合文本和图像实现个性化生成。同时介绍了ImagenHub库以标准化条件图像生成的评估,并提出了DreamInpainter方法用于文本导向的图像修复。研究分析了扩散模型的现有方法,探讨了其局限性及未来方向。

ArtiFade: 从有缺陷图像生成高质量主题图像的学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

本文介绍了一种新的个性化文本到图像模型,通过少量输入图像微调预训练模型,实现高质量图像生成。研究提出了多主题生成的解决方案,利用文本嵌入和布局增强图像-文本对齐效果。同时,介绍了基于文本的图像修复技术,结合文本和示例图像进行修复,确保主题一致性和视觉质量。此外,ConsiStory方法实现了无需训练的主题一致性生成,LAR-Gen则专注于遮挡场景的修复,展现了在身份保护和文本语义一致性方面的优势。

RealCustom++:将图像表示为真实词以实现实时定制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本文介绍了多种先进的文本到图像生成模型,如DiffBlender、HyperDreamBooth和ZipLoRA。这些模型通过不同方法实现个性化生成,显著提高了生成速度和质量,并在风格和主题保真度方面表现优异。研究还探讨了快速采样和参数等级减少等技术,以进一步优化个性化图像生成的效率和准确性。

DiffLoRA:利用扩散生成个性化低秩适应权重

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文介绍了基于扩散模型的360度全景图像生成技术,提出了RenderDiffusion模型,能够从2D图像生成3D场景,并在多个数据集上表现优越。研究还探讨了个性化生成方法,强调全局几何特性和高质量输出。通过优化框架TwinDiffusion,解决了接缝和过渡问题,显著提升了生成质量和效率。

CamFreeDiff: 无摄像头的基于扩散模型的图像拼接生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文提出了一种名为Subject-Diffusion的开放域个性化图像生成模型,能够通过参考图像实现个性化生成。研究构建了一个包含7600万图像的大规模数据集,并设计了统一框架以提高生成准确性。该模型在单一和多主体生成方面优于现有技术,采用注意力控制机制增强生成效果。

JeDi:联合图像扩散模型用于零微调个性化文本到图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

DreamHuman 是一种自动生成三维人物头像模型的方法,结合文本到图像合成、神经辐射场和统计人体模型,生成高质量的动态三维头像。通过改进的 2D 条件扩散模型,增强用户对三维内容的控制,解决几何不一致性问题。DreamView 和其他框架如 DreamAvatar 进一步提升了三维生成的个性化和一致性,推动了创意应用的发展。

YouDream: 生成可解剖控制的一致性文本到三维动物

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文介绍了新型神经网络结构和模型,如MoA、MoMA和TC-MoA,旨在提升自然语言处理和图像生成任务的性能。这些模型通过动态选择注意力头和新颖的自注意力方法,在个性化生成和图像融合方面表现出色,提供更高的细节保真度和身份保留性。此外,研究提出了针对多概念个性化的框架OMG,展示了其在复杂图像生成任务中的优势。

MoA: 个性化图像生成中的主题 - 上下文分离的注意力混合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-17T00:00:00Z

高频率促进适应(HiPA)是一种高效的图像生成方法,通过低秩适配器提升扩散模型的高频能力。研究表明,HiPA在文本到图像生成中表现优越,训练速度显著提高。该方法结合人类偏好,优化生成模型,增强图像的视觉吸引力和文本对齐性。此外,研究还提出了新颖的蒸馏方法和个性化文本到图像生成框架,进一步提升了模型的灵活性和适应性。

扩散模型中与模型无关的人类偏好反转

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

本研究提出了一种新颖的图像合成方法,专注于保留人物身份,利用直接前馈机制和混合引导框架生成高质量艺术肖像和身份融合图像。通过优化面部识别编码器和自我增强学习,提升了生成速度和质量,并探讨了大幅度编辑和个性化人脸生成的技术,展示了在各种数据集上的优越性能。

DreamSalon: 一个分阶段扩散框架,用于保留可编辑面部生成中的身份 - 语境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码