小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Luma Labs推出Uni-1:一种在生成图像前能够推理意图的自回归Transformer模型

Luma Labs推出的Uni-1是一种自回归Transformer架构的图像模型,能够在生成前进行推理,提升文本与图像的理解与生成能力。该模型在RISEBench和ODinW-13基准测试中表现优异,展现出在视觉认知和空间逻辑处理方面的优势。Uni-1支持简单英语指令,定价约为每张0.10美元,未来将推出API接口。

Luma Labs推出Uni-1:一种在生成图像前能够推理意图的自回归Transformer模型

实时互动网
实时互动网 · 2026-03-24T02:46:57Z
【案例共创】昇腾NPU部署SDXL文生图模型

本文介绍了在华为开发者空间中使用昇腾NPU部署SDXL文生图模型的案例。SDXL是一种先进的文本生成图像模型,适合个人开发者和高校学生,预计操作时间为30分钟。用户可通过Notebook环境进行代码开发,生成不同主题的图像,如三体太空电梯和古风美女。

【案例共创】昇腾NPU部署SDXL文生图模型

华为云官方博客
华为云官方博客 · 2025-12-22T14:30:00Z
刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测

OpenAI推出的GPT-Image-1.5图像模型具备更精准的编辑能力和更快的生成速度,能够理解复杂指令并保持画面一致性,适用于多种场景。尽管中文表现有待提升,但其图像生成能力显著增强,标志着AI图像工具向实用化转变。

刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测

爱范儿
爱范儿 · 2025-12-17T04:31:20Z
FLUX.2 Pro图像模型现已在Vercel AI Gateway上提供

FLUX.2 Pro是Black Forest Labs推出的新图像模型,支持高达4MP的输出,具备更好的现实知识和光照控制,提供多参考输入和精确的色彩匹配。使用时需在AI SDK中设置为bfl/flux-2-pro。

FLUX.2 Pro图像模型现已在Vercel AI Gateway上提供

Vercel News
Vercel News · 2025-11-25T13:00:00Z

Nano Banana是Gemini应用中的新图像模型,自8月推出以来生成超过50亿个创作。它支持文本和图像的同时处理,允许一致性编辑和像素级修改,用户可通过简单指令完成复杂任务。Nano Banana还可与Canvas和AI Studio集成,助力用户轻松创建图像应用。团队持续改进,推动人类创造力的释放。

使用Nano Banana创作惊人图像的4个技巧

The Keyword
The Keyword · 2025-10-02T16:00:00Z

Midjourney推出了流畅且细节丰富的视频生成模型,引发网友热议。尽管目前缺乏音频功能,团队仍在持续完善,并鼓励用户参与评分。同时,图像模型V7也在更新,支持语音生成并提升渲染速度。

Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了

量子位
量子位 · 2025-06-17T06:45:10Z

本研究提出显式逻辑叙述提示(ELNP),旨在改善反事实文本与图像模型的概念对齐问题。实验结果表明,该方法显著提升了对齐效果。

Substitutes in Translation: Enhancing Conceptual Alignment from Counterfactual Text to Image

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
字节跳动的Hyper-Flux-16step模型初学者指南

Hyper-Flux-16step是字节跳动开发的文本生成图像模型,能够根据文本提示生成高质量的图像,支持图像尺寸、种子值和引导强度等多种输入参数,输出格式为WebP。

字节跳动的Hyper-Flux-16step模型初学者指南

DEV Community
DEV Community · 2025-05-15T01:49:56Z

ModelScope团队推出了开源全能图像模型Nexus-Gen,具备图像理解、生成和编辑能力,性能接近GPT-4o。该模型结合了MLLMs的语言建模与扩散模型的图像建模,采用高维特征空间建模以提升图像质量,解决了误差累计问题。Nexus-Gen的训练数据来自开源社区,未来将继续优化并开源相关资源。

开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题

量子位
量子位 · 2025-05-12T07:52:57Z
如何在Django中创建图像模型(包含设置)

在Django中创建图像模型需安装Pillow并配置settings.py。定义ImageModel,设置MEDIA_URL和MEDIA_ROOT,更新urls.py以处理媒体文件。创建上传视图和表单,设计HTML模板,最后启动Django服务器以上传和显示图像。

如何在Django中创建图像模型(包含设置)

DEV Community
DEV Community · 2025-03-18T17:40:18Z

本研究提出了WISE基准,旨在评估文本生成图像模型在复杂语义理解和世界知识整合方面的不足。通过引入WiScore指标,对20个模型进行测试,揭示了它们在知识应用中的局限性,为未来模型改进提供了方向。

WISE: A Semantic Evaluation Method Based on World Knowledge for Text-to-Image Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
如何在Google Colab上运行stable-diffusion-3.5-large-turbo

stable-diffusion-3.5-large-turbo是一个高精度文本生成图像模型。使用前需在Huggingface注册并创建访问令牌。通过Google Colab安装必要库,验证账户后下载模型,最后运行代码生成并保存图像。

如何在Google Colab上运行stable-diffusion-3.5-large-turbo

DEV Community
DEV Community · 2024-12-08T15:42:22Z
Stability AI在Huggingface上发布的Stable-Diffusion-Xl-Base-1.0模型初学者指南

Stable-Diffusion-Xl-Base-1.0是Stability AI开发的文本生成图像模型,利用预训练的文本编码器,根据文本提示生成和修改图像,可独立使用或作为两阶段管道的一部分。

Stability AI在Huggingface上发布的Stable-Diffusion-Xl-Base-1.0模型初学者指南

DEV Community
DEV Community · 2024-11-12T00:12:15Z
如何微调SDXL

SDXL(Stable Diffusion XL)是Stability AI开发的高级文本生成图像模型,具有高分辨率、改进的文本理解和多样的艺术风格。用户可通过MonsterAPI轻松微调SDXL,无需编写代码,适用于艺术创作、内容生成和教育资源等多种应用。

如何微调SDXL

DEV Community
DEV Community · 2024-11-09T08:16:49Z
亚马逊SageMaker JumpStart扩展产品组合,整合Bria AI的文本生成图像模型

亚马逊网络服务将Bria AI的文本生成图像模型整合进SageMaker JumpStart,推出Bria 2.3、2.2 HD和2.3 Fast版本,以满足企业的视觉内容需求。Bria模型注重合规性和安全性,支持高分辨率输出和快速响应,适用于多种应用场景。开发者可通过SageMaker Studio和Python SDK进行定制和部署。

亚马逊SageMaker JumpStart扩展产品组合,整合Bria AI的文本生成图像模型

InfoQ
InfoQ · 2024-11-06T08:00:00Z

通过合成服装动画,推测服装动态特征,提供服装结构概述,使用图像模型生成参考图像,构建神经辐射场渲染服装动画。能重新上色服装,适用于未见过的动作和视角,保持细节结构一致。在服装动力学和皱褶细节建模方面有质量和数量上的改进。

服装动画 NeRF 与颜色编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

该研究提出了一种文本本地化的文本到图像模型,通过交叉注意力引导方法建立目标概念的视觉表示与标识符令牌之间的连接。实验结果表明,该方法在图像保真度和图像文本对齐方面优于基准模型,并提高了单一概念和多概念生成的得分。该方法还能够生成与目标概念一致的交叉注意力映射。

文本定位:为主题驱动的文本到图像生成分解多概念图像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-15T00:00:00Z

本文提出了一种直接改变提示嵌入的方法,通过将生成的文本到图像模型视为一个连续函数,并在图像空间和提示嵌入空间之间传递梯度,解决了不同的用户交互问题。实验证明了该方法的可行性。

稳定扩散提示的嵌入操纵

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码