小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
不卷参数卷架构,这个开源模型把图像理解和生成统一了

商汤推出了开源图像生成模型SenseNova-U1,具备高效的图文创作能力,支持复杂信息图和连贯的图文输出。其底层架构NEO-unify提升了创作效率。尽管存在局限,商汤将持续改进并已向公众开放该模型。

不卷参数卷架构,这个开源模型把图像理解和生成统一了

量子位
量子位 · 2026-04-29T04:27:03Z
0博士组合拿下ICLR时间检验奖!两个GPT天才本科生+二本逆袭LeCun弟子,十年论文终封神

Alec Radford因其DCGAN论文获得ICLR 2026时间检验奖,该论文在机器学习领域具有深远影响,奠定了图像生成研究的基础。三位作者均非博士生,来自不同背景。DCGAN推动了生成对抗网络的发展,至今仍具重要意义。

0博士组合拿下ICLR时间检验奖!两个GPT天才本科生+二本逆袭LeCun弟子,十年论文终封神

量子位
量子位 · 2026-04-25T03:35:53Z
OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

OpenClaw 2026.4.23版本接入GPT-5.5,提升了图像生成能力和智能体上下文机制。新增Codex OAuth和OpenRouter双通道,简化API管理。分支上下文机制允许子智能体继承主会话历史,避免信息丢失。超时控制和本地嵌入模型长度可调,适应不同资源环境。集成Telegram、Slack和WhatsApp优化了消息稳定性,提升用户体验。

OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

极道
极道 · 2026-04-24T21:55:00Z
GPT-image-2实测效果炸场了,真正让想象力 变成了“可见”,请大家欣赏实测效果

GPT-image-2是一款先进的图像生成模型,具备强大的中文理解能力,能够将语言中的情感和风格转化为生动图像。它在细节表现、风格控制和创作自由度上有显著提升,适用于设计、写作和内容创作等领域。用户可通过优化的中文提示词轻松生成高质量图像。

GPT-image-2实测效果炸场了,真正让想象力 变成了“可见”,请大家欣赏实测效果

dotNET跨平台
dotNET跨平台 · 2026-04-24T00:01:30Z
半壁华人!GPT Image 2团队曝光:无锡才俊带队,13人4个月封神

GPT Image 2的底层架构已彻底重构,研究负责人陈博远称其为“通用模型”。团队仅13人,快速取得显著进展,新模型在指令遵循和空间布局方面表现出色,能够精准生成复杂图像。团队成员背景多样,涵盖计算机视觉和机器学习等领域,OpenAI持续吸引跨界人才,推动技术创新。

半壁华人!GPT Image 2团队曝光:无锡才俊带队,13人4个月封神

量子位
量子位 · 2026-04-23T08:04:09Z
OpenClaw v2026.4.21小更新:gpt-image-2 默认上线与权限安全加固

OpenClaw v2026.4.21更新了图像生成默认模型为gpt-image-2,支持2K/4K输出,并修复了插件依赖问题。权限命令安全逻辑收紧,确保只有拥有者可以访问特定命令。同时,Slack线程消息发送和浏览器无障碍引用处理也得到了优化。

OpenClaw v2026.4.21小更新:gpt-image-2 默认上线与权限安全加固

极道
极道 · 2026-04-22T22:26:00Z
无需科学上网,国内丝滑使用最新GPT-Image-2!

最新的「Image-2」图像模型已在椒图AI上线,功能超越前作,用户可通过提示词生成海报、直播截图和热搜截图等多种图像,提供丰富的设计体验,鼓励用户发挥想象力。

无需科学上网,国内丝滑使用最新GPT-Image-2!

小众软件
小众软件 · 2026-04-22T09:02:49Z

OpenAI 发布了全新的图像生成模型 Images 2.0,显著提升了图像生成的细节、逻辑和可用性。新模型减少了中文字符的乱码,提升了文本渲染质量,支持多语言和复杂指令理解,能够批量生成风格一致的图像,推动内容生产效率和行业变革。

OpenAI推出图像生成模型Images 2.0 图像细节和逻辑都有显著提升

蓝点网
蓝点网 · 2026-04-22T06:34:17Z

OpenAI 更新了 GPT Image 2,生成的图片在光影处理和细节一致性上有显著提升,几乎难以辨别真伪。这对摄影和设计行业产生了深远影响,可能导致虚假信息的传播,未来真实性将成为稀缺资源,专业人士的价值可能因可信度而重新评估。

GPT Image 2:以假乱真的时代来了

王佳冬中文博客
王佳冬中文博客 · 2026-04-22T03:04:13Z
随着ChatGPT Images 2.0的推出,OpenAI现在在绘图前会进行“思考”

OpenAI推出的ChatGPT Images 2.0标志着图像生成技术的重大进步。该模型具备推理能力,能够从单一提示生成多达八幅图像,并进行自我验证。它支持多种语言,尤其在处理非拉丁文本方面表现出色,尽管在某些复杂任务上仍有局限,但为创意工作提供了更高的准确性和一致性。

随着ChatGPT Images 2.0的推出,OpenAI现在在绘图前会进行“思考”

The New Stack
The New Stack · 2026-04-21T22:54:41Z
OpenAI更新版图像生成器现可从网络获取信息

OpenAI推出了更新版的图像生成器ChatGPT Images 2.0,具备新的思考能力,能够从网络获取信息,并基于单一提示生成多幅图像。该版本支持更高分辨率和多种图像比例,提升了细节把握和文本生成能力,适用于多种语言。用户可同时生成最多八幅图像,适合漫画和社交图形等创作。

OpenAI更新版图像生成器现可从网络获取信息

The Verge
The Verge · 2026-04-21T19:00:00Z
AI Gateway上的GPT Image 2

OpenAI发布了GPT Image 2,支持详细指令、物体关系和多种比例的文本渲染。该模型可生成高达2K分辨率的图像,适用于游戏原型、故事板和市场创意等工作流程。用户可通过AI SDK使用该模型。

AI Gateway上的GPT Image 2

Vercel News
Vercel News · 2026-04-21T07:00:00Z
阿里发布Wan2.7-Image,人类偏好盲测评分国内第一

阿里巴巴发布了图像生成与编辑模型Wan2.7-Image,解决了AI生图的审美疲劳和色彩控制问题。该模型支持文生图、图生组图及交互式编辑,适用于影视、自媒体和电商等多个行业,用户可通过调色盘功能精准控制色彩,实现个性化定制,提升创作效率。

阿里发布Wan2.7-Image,人类偏好盲测评分国内第一

量子位
量子位 · 2026-04-20T08:59:05Z
马斯克来抖音卖老干妈了??

OpenAI最新的图像生成模型GPT Image 2已达到以假乱真的水平,生成的图片和文字几乎无法辨别真假。这一技术进步可能会对设计行业产生重大影响,降低创作门槛,同时也引发了对虚拟与现实融合的担忧,可能导致信息安全问题。

马斯克来抖音卖老干妈了??

量子位
量子位 · 2026-04-19T04:47:09Z
OpenAI的Codex重大更新直接针对Claude Code

OpenAI更新了Codex,使其能够在macOS上控制桌面应用程序、生成图像并记住用户的过去经验。新功能包括后台操作、并行工作、图像生成、插件支持和内置浏览器,旨在提升用户效率并增强与谷歌和Anthropic的竞争力。

OpenAI的Codex重大更新直接针对Claude Code

The Verge
The Verge · 2026-04-16T17:00:00Z

Gemini应用程序利用用户的兴趣和Google Photos库,简化图像生成过程。用户只需输入简单提示,如“设计我的梦想房屋”,Gemini便能自动生成符合个人风格的图像。用户可以使用实际照片,确保生成的图像更具个性化,并可调整生成结果以保持创作控制。该功能将逐步向美国的Google AI Plus、Pro和Ultra订阅用户推出。

在Gemini应用程序中创建个性化图像的新方法

The Keyword
The Keyword · 2026-04-16T16:00:00Z
谷歌在Mac上推出Gemini AI应用程序

谷歌推出了适用于Mac的Gemini AI应用程序,用户可以通过桌面与AI助手互动。该应用支持快捷键调出聊天窗口,并需授权访问系统信息。Gemini能够生成图像、视频和音乐,并支持从Google Drive上传文件,旨在与OpenAI等竞争。

谷歌在Mac上推出Gemini AI应用程序

The Verge
The Verge · 2026-04-15T18:10:15Z
微软一口气发布3个AI模型:能听、会说、还能画,实测后我有点意外

微软于4月2日发布了三款新模型:MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2。MAI-Image-2在图像生成方面表现优异,适合设计与创意;MAI-Transcribe-1在嘈杂环境中稳定,适合会议与客服;MAI-Voice-1提供自然语音合成,情绪可控。这些模型在稳定性和实用性上有所提升。

微软一口气发布3个AI模型:能听、会说、还能画,实测后我有点意外

dotNET跨平台
dotNET跨平台 · 2026-04-05T23:56:36Z
Modular 26.2:先进的图像生成与Mojo优化的AI编程

Modular平台发布26.2版本,新增图像生成和编辑功能,支持FLUX.2模型,性能提升4倍。Mojo语言优化AI编程,简化GPU内核开发,支持CUDA转Mojo。此版本提升了图像生成速度,降低了总拥有成本,适用于云和企业用户。

Modular 26.2:先进的图像生成与Mojo优化的AI编程

Modular Blog
Modular Blog · 2026-03-19T00:00:00Z
ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

扩散模型在图像生成方面取得了重要进展,但由于推理步骤多和分辨率限制,实际应用受到制约。为提高效率和图像保真度,提出了GenDR和GenDR-Pix模型,优化了VAE和UNet,支持高分辨率图像处理,增强了细节恢复效果,推动生成技术与实际业务的结合。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

实时互动网
实时互动网 · 2026-03-04T06:39:12Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码