小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
用了两天 iOS 27,我「AI」上了 Siri

苹果在WWDC 26上发布了iOS 27,重点升级了Siri AI,提升了其沟通能力和多模态功能。新Siri能更自然地理解和执行复杂指令,支持图像生成和编辑,整体体验显著改善,标志着苹果在AI领域的重要进步。

用了两天 iOS 27,我「AI」上了 Siri

爱范儿
爱范儿 · 2026-06-12T07:00:11Z
OpenAI Images Generations API 申请及使用

OpenAI图像生成API支持多种模型,如gpt-image-2,具备优越的指令遵循和文字渲染能力。用户需注册获取凭证,首次申请有免费额度。API允许用户通过指定参数生成高质量图像,支持多种尺寸和风格,并可选择同步或异步回调机制以处理长时间请求。文中还提供了调用示例和错误处理方法。

OpenAI Images Generations API 申请及使用

静觅
静觅 · 2026-06-10T20:46:47Z
Midjourney Imagine API 申请及使用

本文介绍了Midjourney Imagine API的申请与使用流程。用户通过输入关键字生成图像,申请API后可使用授权和描述生成所需图像。API支持图像放大、变换和局部重绘等操作,用户可通过Webhook接收生成结果,流式输出功能提升了实时查看生成进度的体验。

Midjourney Imagine API 申请及使用

静觅
静觅 · 2026-06-07T21:14:51Z
Midjourney MCP 对接指南

Midjourney MCP 是由 Anthropic 推出的模型上下文协议,允许 AI 模型通过标准接口调用外部工具。用户可以在 AceData Cloud 的 Midjourney MCP Server 上生成和编辑图像,核心功能包括图像生成、编辑、变换、混合和描述。使用前需获取 API Token,并可选择托管或本地运行,配置完成后可通过自然语言调用这些功能。

Midjourney MCP 对接指南

静觅
静觅 · 2026-06-06T06:17:38Z
微软首款高级推理人工智能问世

微软在2026年Build大会上发布了多款新AI模型,旗舰模型MAI-Thinking-1是其自主开发的重要进展,表现优异,基于干净数据训练。此外,还推出了图像生成、转录、语音和编码等模型,提升了处理速度和语言支持。

微软首款高级推理人工智能问世

The Verge
The Verge · 2026-06-02T18:12:44Z
JetBrains 对接 Seedream MCP

JetBrains 与 Seedream MCP 的对接使用户能够在 IntelliJ IDEA、PyCharm 和 WebStorm 中直接调用图像生成和编辑功能。用户需注册 AceData Cloud 平台并获取 API Token,配置后可生成中国风山水画或国潮插画等。

JetBrains 对接 Seedream MCP

静觅
静觅 · 2026-06-01T07:58:42Z
今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

Agnes AI正式向全球开发者免费开放文本、图片和视频API,旨在降低使用门槛,促进创作与开发。其模型能够生成高质量的交互稿、图像和视频,支持多种应用场景,简化操作以推动AI技术的实际应用。

今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手

量子位
量子位 · 2026-06-01T07:57:16Z
OpenClaw v2026.5.28更小更快、支持Claude Opus 4.8

OpenClaw 2026.5.28版本更新显著提升了性能和稳定性,支持Claude Opus 4.8模型,启动速度加快14.5%,安装体积减半。子任务管理和聊天通道的稳定性得到改善,确保消息准确送达。新功能包括Krea图像生成和MiniMax音乐回复,整体优化使系统在复杂任务处理时更可靠,用户体验更流畅。

OpenClaw v2026.5.28更小更快、支持Claude Opus 4.8

极道
极道 · 2026-05-30T21:40:00Z
Adobe的对话式AI助手是一名平庸的设计实习生

Adobe的Firefly AI助手是一款设计辅助工具,旨在减轻创作负担并提供创意控制。虽然其编辑效果不如专业设计师,但用户可以通过对话式界面与其互动,了解编辑过程。助手能够执行图像生成和调整等多种任务,但在处理复杂请求时表现有限。总体而言,它适合希望简化设计流程的用户,但对于专业人士来说,效果仍显稚嫩。

Adobe的对话式AI助手是一名平庸的设计实习生

The Verge
The Verge · 2026-05-29T10:00:00Z
OpenCode + Seedream MCP

本文介绍了如何在 OpenCode 中使用字节跳动的 AceData Cloud MCP 图像模型。用户可以获取 API Token,配置后直接调用图像生成和编辑工具,生成中国风山水画或国潮风插画。提供了详细步骤和示例以供参考。

OpenCode + Seedream MCP

静觅
静觅 · 2026-05-29T06:21:56Z
Claude.ai + Midjourney MCP:一句话调出 4 张高清概念图,亲测全流程

Claude.ai与Midjourney MCP结合,用户可通过简单的英文提示生成高清图像,操作简便。MCP协议支持Claude调用外部工具,实现图像放大和变体生成。用户只需登录AceData Cloud并授权,生成的图像链接稳定,适合用于博客和设计。

Claude.ai + Midjourney MCP:一句话调出 4 张高清概念图,亲测全流程

静觅
静觅 · 2026-05-26T21:23:42Z
全新生图模型 Anima V1 发布:专注动漫风格的图像生成;MemLens 多模态长程记忆评估数据集:涵盖跨会话图文推理与知识更新机制

Anima V1 是 CircleStone Labs 于 2026 年推出的动漫风格图像生成模型,支持通过文本描述快速生成角色立绘和插画,用户可在 Gradio 界面中调整参数以提升创作效率。

全新生图模型 Anima V1 发布:专注动漫风格的图像生成;MemLens 多模态长程记忆评估数据集:涵盖跨会话图文推理与知识更新机制

HyperAI超神经
HyperAI超神经 · 2026-05-22T08:35:01Z
专注动漫风格,全新生图模型Anima V1已开源;哈佛大学发布机器学习系统教学平台MLSysBook,含33个可交互实验

Anima V1 是 CircleStone Labs 于 2026 年发布的动漫风格图像生成模型,用户可以通过文本描述生成精美图像,适用于角色立绘和插画,并支持在线调节参数以提升创作效率。

专注动漫风格,全新生图模型Anima V1已开源;哈佛大学发布机器学习系统教学平台MLSysBook,含33个可交互实验

HyperAI超神经
HyperAI超神经 · 2026-05-22T03:39:41Z

Nano Banana推出了Gemini Omni,结合图像生成与编辑能力,用户可通过自然语言编辑视频,生成高质量内容。Omni支持图像、音频和文本输入,能够创建真实感强的场景,并具备物理推理能力。首个模型Gemini Omni Flash已上线,未来将扩展更多功能。

介绍Gemini Omni

The Keyword
The Keyword · 2026-05-19T17:45:00Z

谷歌推出多项新功能以提升Google Workspace应用的使用体验,包括Gmail、Docs和Keep的语音功能,用户可通过语音快速搜索和组织信息。新应用Google Pics提供精确的图像生成和编辑工具,支持对象分割和文本编辑。AI Inbox帮助用户高效管理邮件,提供个性化回复和即时文件访问。Gemini Spark是一个24/7的个人AI助手,能根据用户指示执行任务。这些更新旨在节省时间,提高工作效率。

在Google Workspace中创造和完成任务的新方式

The Keyword
The Keyword · 2026-05-19T17:45:00Z
挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

字节团队研发的生成精炼网络(GRN)是一种新一代视觉生成模型,能够在生成过程中实时修改,解决了传统扩散和自回归模型的缺陷。GRN根据画面复杂度智能分配计算步骤,生成效果优于现有主流模型,在图像和视频生成任务中表现出色,为视觉生成开辟了新路径,未来有望提升多模态理解与生成能力。

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

量子位
量子位 · 2026-05-13T14:04:35Z
当ERNIE-Image遇上AMD GPU,一条很容易复现的本地推理路径

本文介绍了如何在AMD GPU上运行ERNIE-Image。通过ROCm和Hugging Face Diffusers,用户可以在Docker环境中部署,步骤包括拉取Docker镜像、安装依赖、准备模型权重和运行推理。ROCm兼容CUDA接口,简化了模型部署过程,使开发者在非CUDA环境中也能使用主流框架进行图像生成。

当ERNIE-Image遇上AMD GPU,一条很容易复现的本地推理路径

百度大脑
百度大脑 · 2026-05-08T12:24:44Z
香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马

Luma AI推出的Uni-1.1 API在图像生成领域取得重大突破,全球排名第三。该模型结合推理与生成,提升品牌一致性和创意可控性,显著降低广告制作成本。Uni-1.1支持多语言渲染,适用于广告本地化和电商可视化,展现出强大的产业应用潜力。

香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马

量子位
量子位 · 2026-05-06T09:24:27Z
带有迭代去噪的归一化流

本文介绍了迭代去噪的归一化流(iTARFlow),一种新型生成模型。与扩散模型不同,iTARFlow在训练中保持完全的端到端似然目标,并在采样时结合自回归生成和迭代去噪过程。实验结果表明,iTARFlow在不同分辨率的图像生成任务中表现优异,展现了其作为强大生成模型的潜力。

带有迭代去噪的归一化流

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-06T00:00:00Z
不卷参数卷架构,这个开源模型把图像理解和生成统一了

商汤推出了开源图像生成模型SenseNova-U1,具备高效的图文创作能力,支持复杂信息图和连贯的图文输出。其底层架构NEO-unify提升了创作效率。尽管存在局限,商汤将持续改进并已向公众开放该模型。

不卷参数卷架构,这个开源模型把图像理解和生成统一了

量子位
量子位 · 2026-04-29T04:27:03Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码