小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了一种用于评估文本到图像生成模型的框架,包括图像质量、概念覆盖和公平性等方面的评估。作者提出了美学评分预测模型,并提供了标记有低质量区域的数据集。研究结果揭示了模型输出中的偏见,并探索了模型对文本概念的解释和渲染的有效性。这种方法可应用于其他形式的图像生成,为下一代生成模型铺平道路。

重新思考手写生成评估:连接生成与识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本文介绍了一种用于评估文本到图像生成模型的框架,包括图像质量、概念覆盖和公平性等方面的评估。作者提出了美学评分预测模型,并提供了一个标记有低质量区域的数据集。研究结果揭示了模型输出中的偏见,并探索了模型对文本概念的解释和渲染的有效性。这种方法可应用于其他形式的图像生成,为下一代生成模型的发展铺平道路。

ITI-GEN:包含式文本到图像生成” 的可再现性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z
Stable Diffusion:一键安装包下载,保姆级安装教程,可在线体验

Stable Diffusion是2022年发布的深度学习文本到图像生成模型,可根据文本描述生成详细图像。它是由慕尼黑大学的CompVis研究团体开发的一种潜在扩散模型,已在GitHub和Hugging Face上发布。

Stable Diffusion:一键安装包下载,保姆级安装教程,可在线体验

文武科技柜
文武科技柜 · 2024-07-18T02:51:02Z

本文提出了一种用于评估文本到图像生成模型的框架,包括图像质量和文本条件的评估。引入了美学评分预测模型和标记低质量区域的数据集。探索了概念覆盖和公平性,并设计了适用于其他图像生成形式的灵活方法。将发布代码和数据集。

超越美学:文本到图像模型中的跨文化能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文介绍了一种用于评估文本到图像生成模型的框架,包括图像质量和文本条件的评估。作者提出了美学评分预测模型和标记低质量区域的数据集。研究探索了模型对概念覆盖和公平性的有效性,并设计了适用于其他形式图像生成的灵活方法。该研究为下一代生成模型的发展提供了基础。

重新思考文本到视频模型的人工评估协议:提升可靠性、可复现性和实用性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z

我们提出了一个新的任务和基准,用于评估文本到图像生成模型在现实生活中产生符合常识的图像的能力。我们评估模型是否能进行视觉常识推理,即生成与文本提示相符的图像。我们发现图像合成与真实生活照片之间仍存在差距。我们的目标是将此作为常识检查的高质量评估基准,促进实际生活图像生成的进展。

常识 T2I 挑战:文本到图像生成模型能否理解常识?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

通过创建VisionPrefer数据集,利用多模态大型语言模型指导文本到图像生成模型的训练,捕捉人类喜好,优于之前的偏好度量标准。将人工智能生成的合成数据作为监督信号集成到视觉生成模型中,实现与人类偏好更好对齐的有前途的途径。

基于人的感知的多模态模型的个体对齐的 POV 学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z

最近的文本到图像生成模型擅长模仿受版权保护的内容,引起艺术家担忧。本文重新定义“艺术版权侵权”为对图像集进行分类问题,并介绍了ArtSavant工具。该工具通过与372位艺术家作品组成的参考数据集比较,确定艺术家独特风格,并识别其是否出现在生成的图像中。实证研究揭示了三种流行的文本到图像生成模型中艺术风格被复制的普遍情况。在大量艺术家数据集中,仅有20%的艺术家风格有被复制的风险。

使用单个图像对定制文本到图像模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-02T00:00:00Z

最近的文本到图像生成模型擅长模仿受版权保护的内容,引起艺术家担忧。本文重新定义“艺术版权侵权”为对图像集进行分类问题,并介绍了ArtSavant工具,可确定艺术家独特风格并识别其是否出现在生成的图像中。实证研究揭示了三种流行的文本到图像生成模型中艺术风格被复制的普遍情况。在大量艺术家数据集中,仅有20%的艺术家风格有被复制的风险。

文本到图像模型中的人类内容版权保护插件授权

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-18T00:00:00Z

本文介绍了一种用于评估文本到图像生成模型的框架,包括图像质量和文本条件两个组别。框架包含美学评分预测模型和标记低质量区域的数据集。研究探索了模型对概念覆盖和公平性的有效性,为下一代生成模型铺平道路。

文本到图像生成中的偏见调查:定义、评估和缓解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

近年来,文本到图像生成模型的发展取得了显著进展。研究者提出了一种名为FlashEval的迭代搜索算法,通过选择文本-图像数据集的代表性子集来改善模型评估过程。FlashEval在COCO和DiffusionDB数据集上证明了其有效性,并发布了这些数据集的精简子集。FlashEval是未来数据集精简的开源工具。

FlashEval:面向快速准确的文本到图像扩散生成模型评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

本研究探讨了文本到图像生成模型中实现最先进美学质量的三个关键点。Playground v2.5通过深入分析和实验,在各种条件和宽高比下展现了最先进的美学质量表现,优于常用的开源模型和闭源商业系统。该研究为提升基于扩散的图像生成模型的美学质量提供了有价值的指导。

Playground v2.5:提升文本到图像生成中的美学质量的三个洞察

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码