小红花·文摘

Stability AI推出了Stable Diffusion 3，是文本生成图像领域最强的AI模型之一，比OPENAI的DALL-E 3效果更好。新模型提高了图像质量，能更好地处理多个主题内容的提示，并解决了在图片中添加文字内容的不准确问题。OPENAI的Sora模型未向公众开放，正在解决AI生成内容的错误信息和仇恨内容等问题。Stability AI也在采取措施防止不良行为滥用Stable Diffusion 3。

Stability AI推出Stable Diffusion 3 不过目前还没法用只能注册候选名单

蓝点网 ·

本文介绍了一种使用文本生成图像的方法，通过结合自然语言界面和空间控制，提出了一种零-shot分割指导方法ZestGuide，可以提高图像质量。实验结果表明，ZestGuide在COCO数据集上的结果更好。

区域：零样本指导下的局部编辑

BriefGPT - AI 论文速递 ·

本文介绍了一种使用文本生成图像的方法，提出了一种零-shot分割指导方法ZestGuide，可以提高图像质量。实验结果表明，ZestGuide的效果更好。

文本增强的空间感知零样本指代图像分割

BriefGPT - AI 论文速递 ·

本文介绍了一种名为ZestGuide的方法，通过结合自然语言界面和空间控制，解决了与图像画布上特定位置对象相关的文本生成图像的问题。实验结果表明，ZestGuide在精准对齐输入分割的情况下，提高了图像质量，并且在COCO数据集上的表现优于Paint with Words。

针对空间控制文本到图像生成的遮蔽注意力扩散引导

BriefGPT - AI 论文速递 ·

本文介绍了一种使用文本生成图像的方法，通过结合自然语言界面和空间控制，解决了与图像画布上特定位置对象相关的文本生成图像的问题。提出了一种零-shot分割指导方法ZestGuide，可以将预先训练的文本插入到图像扩散模型中。实验结果表明，在精准对齐所需的输入分割的情况下，与使用相应分割进行训练的组件相比，提高了图像质量。在COCO数据集上，结果比Paint with Words更好。

五美元模型：从句子嵌入生成游戏地图和角色

BriefGPT - AI 论文速递 ·

这篇文章带你玩转AI绘画

知乎每日精选 ·