小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
研究人员试图揭示扩散模型创造力的起源

斯坦福大学研究人员提出了一种机制,解释扩散模型的创造力,认为创造力源于去噪过程。扩散模型通过学习评分函数逐步去除高斯噪声以生成新图像。研究表明,模型的平移等变性和局部性是关键因素,构建的等变局部评分(ELS)机器准确度超过90%。该理论为理解扩散模型的图像创造及其错误提供了基础。

研究人员试图揭示扩散模型创造力的起源

InfoQ
InfoQ · 2025-07-06T16:00:00Z

两位物理学家研究表明,图像生成AI的“创造力”源于扩散模型的去噪过程,类似于生物细胞的自我组装。他们发现局部性和等变性机制促进了AI的创造力,使其能够生成新颖的图像,揭示了AI与人类创造力的相似性。

物理学家靠生物揭开AI创造力来源:起因竟是“技术缺陷”

量子位
量子位 · 2025-07-04T10:01:33Z

我在研究Step1X-Edit扩散模型,该模型通过vlm编码文字指令和图像,提供高效的图片编辑解决方案。文章详细描述了模型的执行流程,包括图像编码、降采样、噪声构建和去噪过程,旨在分享对该模型的理解和应用。

Step1X-Edit执行流程(一)

李文举
李文举 · 2025-06-24T01:20:08Z
ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

北京大学的研究团队提出了一种姿势和交互感知的人物交互图像生成框架(SA-HOI),通过利用人体姿势和交互边界区域信息进行去噪过程的指导,生成更合理、更真实的人物交互图像。实验结果表明,该方法在人体生成质量、交互语义表达、人物交互距离等方面优于现有模型。

ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

机器之心
机器之心 · 2024-08-08T08:52:36Z

本文介绍了一种名为CamoDiffusion的方法,用于伪装目标检测。该方法使用扩散模型的去噪过程来减少掩蔽的噪声,并能从掩蔽分布中采样多个可能的预测。实验结果表明,该方法在COD数据集上表现出优越的性能。

从噪声伪标签中学习伪装物体检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

该文章介绍了一种基于扩散变压器的新型对话头合成流程,利用音频驱动扩散模型的去噪过程。该方法可推广到多个身份,产生高质量的结果。与现有方法相比,该模型在视觉质量和嘴唇同步准确性方面具有竞争力。该方法在虚拟助手、娱乐和教育等领域有潜力。

DiT-Head:使用扩散变压器进行高分辨率说话人合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码