小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
LWiAI播客第242期 - ChatGPT图像2.0,Qwen 3.6 Max,Kimi-K2.6

本期播客讨论了最新的AI新闻,包括OpenAI发布的ChatGPT图像2.0模型,生成文本和截图的能力显著提升;阿里巴巴推出Qwen 3.6 Max,转为API服务;SpaceX与Cursor达成60亿美元的合作协议;Cerebras申请IPO;亚马逊向Anthropic投资50亿美元。

LWiAI播客第242期 - ChatGPT图像2.0,Qwen 3.6 Max,Kimi-K2.6

Last Week in AI
Last Week in AI · 2026-04-30T07:14:45Z
不卷参数卷架构,这个开源模型把图像理解和生成统一了

商汤推出了开源图像生成模型SenseNova-U1,具备高效的图文创作能力,支持复杂信息图和连贯的图文输出。其底层架构NEO-unify提升了创作效率。尽管存在局限,商汤将持续改进并已向公众开放该模型。

不卷参数卷架构,这个开源模型把图像理解和生成统一了

量子位
量子位 · 2026-04-29T04:27:03Z
Open Generative AI免费开源无审查AI工作室 | 替代Higgsfield和Krea的最佳选择

Open Generative AI是一个完全免费、开源的AI图像和视频生成平台,提供200多个模型,无需订阅,用户创作成果归自己所有。该平台不进行内容审核,确保用户隐私和自由创作,适合自由创作者和技术人员,支持图生视频和对口型生成,使用简单,无需高配置硬件。

Open Generative AI免费开源无审查AI工作室 | 替代Higgsfield和Krea的最佳选择

极道
极道 · 2026-04-28T11:49:00Z
OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

OpenClaw 2026.4.23版本接入GPT-5.5,提升了图像生成能力和智能体上下文机制。新增Codex OAuth和OpenRouter双通道,简化API管理。分支上下文机制允许子智能体继承主会话历史,避免信息丢失。超时控制和本地嵌入模型长度可调,适应不同资源环境。集成Telegram、Slack和WhatsApp优化了消息稳定性,提升用户体验。

OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

极道
极道 · 2026-04-24T21:55:00Z

OpenAI 发布了全新的图像生成模型 Images 2.0,显著提升了图像生成的细节、逻辑和可用性。新模型减少了中文字符的乱码,提升了文本渲染质量,支持多语言和复杂指令理解,能够批量生成风格一致的图像,推动内容生产效率和行业变革。

OpenAI推出图像生成模型Images 2.0 图像细节和逻辑都有显著提升

蓝点网
蓝点网 · 2026-04-22T06:34:17Z
ChatGPT 图像 2.0 正式发布了,这次有点强

ChatGPT Images 2.0正式发布,能够生成高质量、逼真的AI图片。用户只需简短提示即可创建多语言信息图和漫画,展示研究成果。尽管技术进步显著,但在某些复杂任务上仍存在局限性。

ChatGPT 图像 2.0 正式发布了,这次有点强

小众软件
小众软件 · 2026-04-22T02:31:33Z
OpenAI更新版图像生成器现可从网络获取信息

OpenAI推出了更新版的图像生成器ChatGPT Images 2.0,具备新的思考能力,能够从网络获取信息,并基于单一提示生成多幅图像。该版本支持更高分辨率和多种图像比例,提升了细节把握和文本生成能力,适用于多种语言。用户可同时生成最多八幅图像,适合漫画和社交图形等创作。

OpenAI更新版图像生成器现可从网络获取信息

The Verge
The Verge · 2026-04-21T19:00:00Z
介绍 ChatGPT 图像 2.0

抱歉,我无法处理该请求,因为您没有提供具体的文章内容。请提供文章的主要内容,我将为您进行总结。

介绍 ChatGPT 图像 2.0

OpenAI
OpenAI · 2026-04-21T12:00:00Z
Insta360将在其下一款无线麦克风上配备屏幕,以显示标志或图像

Insta360推出的新款无线麦克风Mic Pro,配备可定制的E Ink彩色屏幕,具备三麦克风阵列和AI处理器,支持降噪功能,并可直接与多款相机连接,确保录音可靠。预计将在今年全球发布。

Insta360将在其下一款无线麦克风上配备屏幕,以显示标志或图像

The Verge
The Verge · 2026-04-20T19:00:00Z

谷歌照片推出新的修饰工具,帮助用户快速改善照片效果,包括细化肤质、去除瑕疵、提亮眼睛和美白牙齿。用户只需选择面部并调整效果强度。这些工具正在全球范围内逐步推出,适用于至少4GB内存和Android 9.0及以上版本的设备。

谷歌照片图像编辑器中的新修饰工具让您快速进行细微调整。

The Keyword
The Keyword · 2026-04-20T17:00:00Z
π0.7——4层prompt下的技能组合泛化能力:先高层策略基于指令历史和当前画面输出子任务指令,后世界模型基于子任务指令生成子目标图像

π0.7是一种新型通用机器人模型,具备强大的组合泛化能力。通过多模态数据和详细上下文标注,该模型能够有效执行多样化任务,并在新任务中展现灵巧技能。它结合了人类视频和机器人自主数据,提升了在复杂环境中的表现。引入子目标图像和任务元数据增强了模型的指令理解和执行能力,使其在多样化数据上训练时表现出色。

π0.7——4层prompt下的技能组合泛化能力:先高层策略基于指令历史和当前画面输出子任务指令,后世界模型基于子任务指令生成子目标图像

结构之法 算法之道
结构之法 算法之道 · 2026-04-19T09:37:07Z

Gemini应用程序利用用户的兴趣和Google Photos库,简化图像生成过程。用户只需输入简单提示,如“设计我的梦想房屋”,Gemini便能自动生成符合个人风格的图像。用户可以使用实际照片,确保生成的图像更具个性化,并可调整生成结果以保持创作控制。该功能将逐步向美国的Google AI Plus、Pro和Ultra订阅用户推出。

在Gemini应用程序中创建个性化图像的新方法

The Keyword
The Keyword · 2026-04-16T16:00:00Z
Gemini 现在可以从谷歌照片中提取内容生成个性化图像

谷歌的个人智能功能现已与谷歌照片连接,用户可以通过输入提示生成个性化图像,如“设计我的梦想之家”。该功能将在未来几天内向美国的AI Plus、Pro和Ultra订阅用户推出。

Gemini 现在可以从谷歌照片中提取内容生成个性化图像

The Verge
The Verge · 2026-04-16T16:00:00Z
无需联网!基于 .NET + YOLO 的桌面端图像与视频目标检测实战

本文介绍了一款基于.NET开发的轻量级桌面应用,利用YOLO模型实现本地目标检测。该工具支持图片和视频的实时分析,界面简洁,操作简单,适合非技术人员使用。所有处理在本地完成,保障数据隐私,并支持GPU加速,适用于工业检测和安防监控等场景。

无需联网!基于 .NET + YOLO 的桌面端图像与视频目标检测实战

dotNET跨平台
dotNET跨平台 · 2026-04-15T00:02:54Z
WPF 打造工业级图像控件:支持海康相机与 ROI 框选

本文介绍了一个基于WPF开发的图像显示控件项目,支持本地图片和海康威视相机接入。项目采用模块化设计,核心功能包括图像加载、缩放、平移及ROI选择。CameraBox控件实现了流畅的用户交互,适用于机器视觉和智能监控系统开发,未来可集成更多功能。

WPF 打造工业级图像控件:支持海康相机与 ROI 框选

dotNET跨平台
dotNET跨平台 · 2026-04-13T23:57:57Z
IQ-LUT:高效图像超分的插值与量化查找表方法 | ICASSP 2026

本文提出IQ-LUT方法,通过插值、非均匀量化和残差学习,解决查找表超分辨率技术的存储膨胀问题。该方法在小模型下实现高质量超分辨率,尤其在复杂纹理和边缘区域表现优异。实验结果表明,IQ-LUT在多个基准数据集上优于现有方法,展现出良好的性能与效率平衡。

IQ-LUT:高效图像超分的插值与量化查找表方法 | ICASSP 2026

实时互动网
实时互动网 · 2026-04-10T03:27:03Z
使用ChatGPT创建图像

ChatGPT可以根据简洁的提示生成原创图像,提示应包含图像目的、主题和视觉风格等信息。通过调整和反馈可快速改进图像。上传多张图片时需清晰描述它们的关系,生成真实人物图像时需使用参考照片并获得许可。

使用ChatGPT创建图像

OpenAI
OpenAI · 2026-04-10T00:00:00Z
康奈尔大学开发多智能体平台EMSeek,仅需2-5分钟即可将电子显微镜图像转化为材料学见解

电子显微技术(EM)结合人工智能推出了多智能体平台EMSeek,显著提升了电子显微数据分析效率。该平台能够快速处理显微图像,实现自动化分割、结构重建和性质预测,从而大幅缩短研究时间,促进材料创新。

康奈尔大学开发多智能体平台EMSeek,仅需2-5分钟即可将电子显微镜图像转化为材料学见解

HyperAI超神经
HyperAI超神经 · 2026-04-09T05:38:38Z
OpenAI全粉丝模式比赛:条款与条件

OpenAI在Instagram上举办“全粉丝模式”比赛,参赛者需年满18岁、居住在印度并拥有公开账户,生成并分享图像。评委将根据创意和相关性评选获胜者,奖品为IPL比赛门票。

OpenAI全粉丝模式比赛:条款与条件

OpenAI
OpenAI · 2026-04-09T00:00:00Z
美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

美团LongCat提出的DiNA原生多模态架构将图像、语音和文本统一为离散Token,突破了传统模型的局限。该模型通过共享参数和机制,实现了更高效的理解与生成,推动了多模态AI的发展。

美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

量子位
量子位 · 2026-04-03T06:24:01Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码