小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了扩散模型生成文本幻觉的问题,发现其主要源于局部生成偏差。当数据分布的不同维度几乎独立时,去噪网络倾向于依赖相关的局部区域,导致生成文本不符合语法。这一发现为理解其他类型的幻觉提供了重要见解。

Understanding Text Hallucination of Diffusion Models via Local Generation Bias

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z

我们引入了一种语义面板作为中介来解码文本到图像的过程,用于支持生成器更好地遵循指示。通过将从输入文本解析的视觉概念经由大型语言模型的辅助排列而成的面板注入到去噪网络作为详细的控制信号来补充文本条件,我们的方法 Ranni 在提高预训练的 T2I 生成器的文本可控性方面取得了进展。我们开发了一个实用系统,并展示了其在连续生成和基于聊天的编辑中的潜力。

PaRa: 個性化文本到圖像擴散通過參數等級降低

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-09T00:00:00Z

研究人员提出了Dual3D框架,可在1分钟内生成高质量的3D资产。使用双模态多视图潜在扩散模型和去噪网络实现一致渲染的三面神经表面。另外,提出了双模态切换推理策略,可在10秒内生成高质量的3D资产。实验证明该方法在减少生成时间的同时提供了最先进的性能。

Dual3D: 双模多视角潜在扩散下高效一致的文本到 3D 生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码