小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
扩散模型揭秘:理解DALL-E和Midjourney背后的技术

扩散模型是一种生成图像的AI算法,通过逐步添加和去除噪声来生成新图像。它包括前向过程(将图像转为噪声)和反向过程(从噪声重建图像)。DALL-E和Midjourney等产品利用文本提示指导生成,采用不同技术实现。

扩散模型揭秘:理解DALL-E和Midjourney背后的技术

KDnuggets
KDnuggets · 2025-08-13T14:00:05Z
GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!

OpenAI最近更新了图像生成模型GPT-4o,支持复杂指令和中文输出,生成效果优于DALL-E 3。该模型允许多模态输入,提升了图像生成的一致性和速度,尽管艺术性略逊于MidJourney。用户可通过语音或文字生成个性化图像,未来将扩展API功能。

GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!

硕鼠的博客站
硕鼠的博客站 · 2025-03-27T00:40:17Z
OpenAI将基于GPT-4o的图像生成功能推出至ChatGPT

OpenAI在ChatGPT中推出了“Images in ChatGPT”功能,所有订阅用户均可生成图像,免费用户每日生成数量与DALL-E相同。新系统在图像生成和文本渲染上有显著改进,能够更准确地绑定多个对象属性。尽管生成速度较慢,但图像质量和知识背景弥补了这一点,生成的图像不带水印,用户拥有使用权。

OpenAI将基于GPT-4o的图像生成功能推出至ChatGPT

The Verge
The Verge · 2025-03-25T18:00:00Z
使用Nitric和OpenAI构建无服务器表情包生成器

本文介绍无服务器架构及其优势,强调开发者可专注于应用代码,无需管理服务器。通过Nitric框架和OpenAI的DALL-E模型,读者将学习构建生成图像的应用程序及相关开发环境和部署步骤。

使用Nitric和OpenAI构建无服务器表情包生成器

The New Stack
The New Stack · 2025-03-10T17:30:06Z
OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?

OpenAI 正在为 Sora 测试图像生成功能,用户可以在视频和图像生成之间切换。Sora 的视频推送分为「Best」和「Top」类别,未来可能会推出图像推送。虽然 DALL-E 4 尚未确认,但可能会基于现有模型。

OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?

机器之心
机器之心 · 2025-02-09T06:26:02Z

本研究探讨了生成超现实主义风格图像的挑战,比较了DALL-E和Deep Dream Generator等模型,发现DALL-E 2在使用ChatGPT提示时效果最佳,为图像生成提供了新的方向。

基于视觉-语言模型的超现实主义风格图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
在Jupyter Notebook中展示AI生成的图像

AI技术如OpenAI可简化流程,通过DALL-E模型根据文本生成图像并存储在Cloudinary。开发者可利用OpenAI API构建动态图像生成应用,Jupyter Notebook是Python用户的首选工具。项目设置需安装Python、Cloudinary账户和OpenAI API密钥,输入提示即可生成并存储图像。

在Jupyter Notebook中展示AI生成的图像

The New Stack
The New Stack · 2024-11-20T15:45:58Z
如何使用 DALL-E 给 PPT 画风格稳定的配图?

使用 DALL-E 画图的三个技巧:1. 使用 DALL-E 的 GPT 代替 GPT-4o,以获得更稳定的出图效果;2. 设定风格和尺寸比例,便于调整;3. 在同一会话中保持风格一致,方便生成新提示词。

如何使用 DALL-E 给 PPT 画风格稳定的配图?

宝玉的分享
宝玉的分享 · 2024-11-12T03:24:28Z

神秘模型“小熊猫”迅速走红,ELO得分超越Flux和Midjourney,胜率达到79%。网友猜测其可能源自Midjourney V7或OpenAI的DALL-E 4,尽管竞技场测试表现不一,但其浓厚的中国风引发了广泛关注。

神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney

量子位
量子位 · 2024-10-29T06:28:52Z
成为AI应用开发者:推荐Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》

在AI快速发展的时代,掌握相关技能很重要。Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》教你用OpenAI API创建应用,包括生成创意和图像的“电影创意”项目,以及用ChatGPT-4构建聊天机器人的“知识库”项目。课程结合HTML、CSS和JavaScript,适合对AI开发感兴趣的人,是AI技术入门的好选择。

成为AI应用开发者:推荐Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》

我爱自然语言处理
我爱自然语言处理 · 2024-10-15T08:10:07Z

该项目使用OpenAI API实时生成AI图像,用户可以下载并上传到Pinata存储。相关资源包括Github仓库和Pinata文件API。

使用DALL-E和Pinata进行图像生成

DEV Community
DEV Community · 2024-10-13T22:13:50Z

Zeta漫画生成器结合手绘艺术与AI技术,利用GPT编写剧本,Dall-E生成背景,手绘角色Alpha Zeta增添情感,生成三格漫画。项目使用PHP和JavaScript,代码开源,未来将继续提升质量,探索AI与艺术的可能。

Zeta漫画:在数字故事中融合AI与艺术

DEV Community
DEV Community · 2024-10-08T00:41:25Z

作者分享了使用DALL-E 3生成图像的经验,特别是在设计“桐铭的技术小屋”Logo时的应用。DALL-E 3是OpenAI的图像生成模型,可以根据复杂文本生成高质量图像。作者强调提示词的重要性,建议包括场景、风格、细节、颜色和情感,以优化效果。经过多次尝试,作者成功生成了满意的Logo,并分享了提示词的结构和优化方法。

重新起航:利用DALL-E 3 设计“桐铭的技术小屋”新Logo

dotNET跨平台
dotNET跨平台 · 2024-10-08T00:10:24Z
ChatGPT现允许免费用户每天使用DALL-E 3生成最多两张图片

OpenAI宣布ChatGPT免费版用户每天可使用DALL-E 3模型生成两张图片。DALL-E 3的关键改进是ChatGPT可提供生成图片的提示,使生成图片更容易。例如,Aditya Ramesh在演示中使用ChatGPT生成了四个选项的标志设计。

ChatGPT现允许免费用户每天使用DALL-E 3生成最多两张图片

The Verge
The Verge · 2024-08-08T21:42:01Z

通过对DALLE-v2和Stable Diffusion两个T2I模型进行评估,发现存在职业偏见和地理位置代表的日常情况。增加提示信息可以缓解偏差,但无法解决其他场景的差异。

DALL-E、Stable Diffusion、SDXL 和 Midjourney 中的自闭症谱视觉刻板印象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

研究了人工智能图像生成系统的伦理问题,着重分析了社会对此的回应以及应对措施。

DALL-E 2 的伦理状况

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z
OpenAI 开发新工具检测 AI 生成图像

OpenAI开发了新工具来检测图像是否由其DALL-E AI图像生成器创建。这些工具包括图像检测分类器和防篡改水印。分类器可以以98%的准确率确定照片是否由AI生成。然而,它在识别其他AI模型的内容方面效果较差。OpenAI还为其文本转语音平台的剪辑添加了水印。这些工具仍在改进中,OpenAI正在寻求用户的反馈以测试其效果。研究人员和非营利新闻组织可以在OpenAI的研究访问平台上测试图像检测分类器。

OpenAI 开发新工具检测 AI 生成图像

The Verge
The Verge · 2024-05-07T21:32:51Z

本文深入探讨了大规模语言模型在数字人文研究中的应用,揭示了其在古籍保护、智能处理和学术创新方面的潜力。通过具体案例展示了人工智能在古籍组织、分类和内容生成中的辅助作用,并探索了艺术创新和文化遗产保护中的应用前景。最后讨论了人工智能技术在数字人文领域中引发的技术、信息和社会交融的挑战和机遇。

从 ChatGPT、DALL-E 3 到 Sora:生成型人工智能如何改变数字人文研究与服务?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

OPENAI展示了DALL-E 2人工智能模型,可以通过提示词生成图像。2023年推出DALL-E 3,具有更好的图片生成特性和解决文本内容和人手问题。现已退役DALL-E 2,用户可继续使用DALL-E 3生成图像。

OPENAI宣布关闭DALL-E 2图像生成模型 因为已经有更强大的DALL-E 3

蓝点网
蓝点网 · 2024-04-19T14:30:59Z
DALL-E 现已支持在 ChatGPT 中编辑图像

DALL-E现在提供了图像编辑工具和预设风格建议,使用户能够更轻松地塑造AI生成的作品。这些更新旨在使DALL-E更加用户友好,并在ChatGPT界面内进行调整和改进。新的风格提示可以作为起点,包括木刻、哥特、合成波和手绘等风格。用户可以选择其中一个风格,并在此基础上进行创作。

DALL-E 现已支持在 ChatGPT 中编辑图像

The Verge
The Verge · 2024-04-03T20:31:10Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码