小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
扩散模型揭秘:理解DALL-E和Midjourney背后的技术

扩散模型是一种生成图像的AI算法,通过逐步添加和去除噪声来生成新图像。它包括前向过程(将图像转为噪声)和反向过程(从噪声重建图像)。DALL-E和Midjourney等产品利用文本提示指导生成,采用不同技术实现。

扩散模型揭秘:理解DALL-E和Midjourney背后的技术

KDnuggets
KDnuggets · 2025-08-13T14:00:05Z
GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!

OpenAI最近更新了图像生成模型GPT-4o,支持复杂指令和中文输出,生成效果优于DALL-E 3。该模型允许多模态输入,提升了图像生成的一致性和速度,尽管艺术性略逊于MidJourney。用户可通过语音或文字生成个性化图像,未来将扩展API功能。

GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!

硕鼠的博客站
硕鼠的博客站 · 2025-03-27T00:40:17Z
OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?

OpenAI 正在为 Sora 测试图像生成功能,用户可以在视频和图像生成之间切换。Sora 的视频推送分为「Best」和「Top」类别,未来可能会推出图像推送。虽然 DALL-E 4 尚未确认,但可能会基于现有模型。

OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?

机器之心
机器之心 · 2025-02-09T06:26:02Z
如何使用 DALL-E 给 PPT 画风格稳定的配图?

使用 DALL-E 画图的三个技巧:1. 使用 DALL-E 的 GPT 代替 GPT-4o,以获得更稳定的出图效果;2. 设定风格和尺寸比例,便于调整;3. 在同一会话中保持风格一致,方便生成新提示词。

如何使用 DALL-E 给 PPT 画风格稳定的配图?

宝玉的分享
宝玉的分享 · 2024-11-12T03:24:28Z
成为AI应用开发者:推荐Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》

在AI快速发展的时代,掌握相关技能很重要。Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》教你用OpenAI API创建应用,包括生成创意和图像的“电影创意”项目,以及用ChatGPT-4构建聊天机器人的“知识库”项目。课程结合HTML、CSS和JavaScript,适合对AI开发感兴趣的人,是AI技术入门的好选择。

成为AI应用开发者:推荐Coursera课程《Build AI Apps with ChatGPT, Dall-E, and GPT-4》

我爱自然语言处理
我爱自然语言处理 · 2024-10-15T08:10:07Z

该项目使用OpenAI API实时生成AI图像,用户可以下载并上传到Pinata存储。相关资源包括Github仓库和Pinata文件API。

使用DALL-E和Pinata进行图像生成

DEV Community
DEV Community · 2024-10-13T22:13:50Z

作者分享了使用DALL-E 3生成图像的经验,特别是在设计“桐铭的技术小屋”Logo时的应用。DALL-E 3是OpenAI的图像生成模型,可以根据复杂文本生成高质量图像。作者强调提示词的重要性,建议包括场景、风格、细节、颜色和情感,以优化效果。经过多次尝试,作者成功生成了满意的Logo,并分享了提示词的结构和优化方法。

重新起航:利用DALL-E 3 设计“桐铭的技术小屋”新Logo

dotNET跨平台
dotNET跨平台 · 2024-10-08T00:10:24Z
ChatGPT现允许免费用户每天使用DALL-E 3生成最多两张图片

OpenAI宣布ChatGPT免费版用户每天可使用DALL-E 3模型生成两张图片。DALL-E 3的关键改进是ChatGPT可提供生成图片的提示,使生成图片更容易。例如,Aditya Ramesh在演示中使用ChatGPT生成了四个选项的标志设计。

ChatGPT现允许免费用户每天使用DALL-E 3生成最多两张图片

The Verge
The Verge · 2024-08-08T21:42:01Z

通过对DALLE-v2和Stable Diffusion两个T2I模型进行评估,发现存在职业偏见和地理位置代表的日常情况。增加提示信息可以缓解偏差,但无法解决其他场景的差异。

DALL-E、Stable Diffusion、SDXL 和 Midjourney 中的自闭症谱视觉刻板印象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

研究了人工智能图像生成系统的伦理问题,着重分析了社会对此的回应以及应对措施。

DALL-E 2 的伦理状况

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文深入探讨了大规模语言模型在数字人文研究中的应用,揭示了其在古籍保护、智能处理和学术创新方面的潜力。通过具体案例展示了人工智能在古籍组织、分类和内容生成中的辅助作用,并探索了艺术创新和文化遗产保护中的应用前景。最后讨论了人工智能技术在数字人文领域中引发的技术、信息和社会交融的挑战和机遇。

从 ChatGPT、DALL-E 3 到 Sora:生成型人工智能如何改变数字人文研究与服务?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

OPENAI展示了DALL-E 2人工智能模型,可以通过提示词生成图像。2023年推出DALL-E 3,具有更好的图片生成特性和解决文本内容和人手问题。现已退役DALL-E 2,用户可继续使用DALL-E 3生成图像。

OPENAI宣布关闭DALL-E 2图像生成模型 因为已经有更强大的DALL-E 3

蓝点网
蓝点网 · 2024-04-19T14:30:59Z
DALL-E 现已支持在 ChatGPT 中编辑图像

DALL-E现在提供了图像编辑工具和预设风格建议,使用户能够更轻松地塑造AI生成的作品。这些更新旨在使DALL-E更加用户友好,并在ChatGPT界面内进行调整和改进。新的风格提示可以作为起点,包括木刻、哥特、合成波和手绘等风格。用户可以选择其中一个风格,并在此基础上进行创作。

DALL-E 现已支持在 ChatGPT 中编辑图像

The Verge
The Verge · 2024-04-03T20:31:10Z
Alfred 5.5 更新,整合 ChatGPT / DALL-E,新增预览缩略图、PDF 预览、MD 预览等功能。

Alfred 5.5是一款macOS生产力工具,引入了ChatGPT和DALL-E工作流,以及图像和PDF预览等功能。还包括记忆配对游戏和截图搜索。用户可以在Alfred中浏览文件夹和预览文件。请注意,工作流需要付费。

Alfred 5.5 更新,整合 ChatGPT / DALL-E,新增预览缩略图、PDF 预览、MD 预览等功能。

小众软件
小众软件 · 2024-03-19T08:20:00Z
OpenAI为DALL-E 3添加新水印

OpenAI的图像生成器DALL-E 3将向图像元数据添加水印,以显示内容的来源。水印包括一个不可见的组件和一个可见的符号。用户可以通过内容凭证验证来检查生成图像的AI工具。水印不会影响图像质量,但可能会稍微增加图像大小。内容来源和真实性联盟(C2PA)正在推广水印的使用。然而,水印可以很容易地被移除,而截屏则会省略元数据。

OpenAI为DALL-E 3添加新水印

The Verge
The Verge · 2024-02-06T22:32:26Z
生成式 AI 面临的抄袭问题 —— Midjourney 和 DALL-E 3 的实验揭示了版权方面的难题 [译]

本文讨论了生成式人工智能(AI)系统在图像生成中可能存在的版权侵犯问题。作者实验证明了OpenAI和Midjourney等公司的系统可能使用了受版权保护的素材进行训练,并能生成与商标角色相似的图像。作者呼吁生成式AI开发者限制使用合法授权的数据进行训练,并对艺术家的贡献给予适当的补偿。问题可能在音乐创作等其他领域中出现。

生成式 AI 面临的抄袭问题 —— Midjourney 和 DALL-E 3 的实验揭示了版权方面的难题 [译]

宝玉的分享
宝玉的分享 · 2024-01-06T21:43:00Z

微软更新了Bing Chat和Windows Copilot等产品,将OPENAI GPT-4 Turbo集成到Copilot中,提供更复杂和更长的任务处理能力。用户可以通过Microsoft Edge访问Copilot的部分功能。微软还在开发一种结合GPT-4、Bing图像搜索和网络搜索数据的新方法来分析图像。Copilot的代码解释器功能对开发者很实用,可以帮助分析、排查错误和编写代码。微软还发布了名为深度搜索的新功能,可以在必应上搜索复杂主题的答案。

微软宣布为Bing Chat/Copilot推出GPT-4 Turbo、DALL-E 3和代码解释器等

蓝点网
蓝点网 · 2023-12-06T04:49:43Z

微软在Windows 11的画图应用中集成了OPENAI DALL-E 3模型,用户可以使用提示词生成图片。该功能已经推出正式版,用户只需更新画图应用后即可使用。每次生成四张图片,用户可以选择一张满意的进行优化。部分用户可能会遇到注册等候名单的提示。

集成DALL-E 3的Windows 11画图正式推出 可以使用AI创作图片

蓝点网
蓝点网 · 2023-11-28T05:32:04Z

本文讨论了DALL-E模型生成图片时prompt的重要性,发现DALL-E 3模型会自动重写prompt以生成更好的图片。编写明确的prompt可以获得更好的结果,但并不容易做到。文章还提到了人类语言的发展方向以及电影《猩球崛起》中的故事。

DALL-E 3的魔法和一点思考

dotNET跨平台
dotNET跨平台 · 2023-11-28T00:01:45Z

OPENAI正在开发一种新的检测器,用于检测DALL-E 3生成的图片,准确率高达99%。该工具尚未发布,但应对AI生成图片的潮流是有道理的。

OPENAI正在开发AI图片检测工具 自称DALL-E 3图像检测成功率达99%

蓝点网
蓝点网 · 2023-10-19T18:18:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码