小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ERNIE-Image开源SOTA !消费级显卡搞定顶级渲染、高密度文本绘图

ERNIE-Image是百度文心团队开发的开源文生图模型,基于8B参数的Diffusion Transformer架构,支持多种视觉风格,适合海报和漫画等内容生产。该模型在Hugging Face上开源,支持多语言生成,降低了创作门槛,鼓励用户参与创作。

ERNIE-Image开源SOTA !消费级显卡搞定顶级渲染、高密度文本绘图

百度大脑
百度大脑 · 2026-04-15T09:16:28Z
STIV:可扩展的文本和图像条件视频生成

视频生成领域取得显著进展,但缺乏系统化开发指南。本文提出STIV,一种结合Diffusion Transformer架构的文本图像条件视频生成方法,支持文本到视频和图像到视频任务。STIV在多项任务中表现优异,为构建先进视频生成模型提供了透明方案,推动未来研究。

STIV:可扩展的文本和图像条件视频生成

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-01T00:00:00Z
AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观

加州大学伯克利分校等机构联合制作的《猫和老鼠》AI短片引发关注。该短片利用测试时训练(TTT)层生成,展示了复杂的动态故事。研究者使用预训练的Diffusion Transformer生成了一分钟的连贯视频,展示了AI在动画创作中的新进展。

AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观

机器之心
机器之心 · 2025-04-09T05:40:48Z

360AI推出了新一代高效可控生成框架RelaCtrl,参数量减少85%,性能超越OminiControl。该框架优化了Diffusion Transformer的控制信号集成,提升了计算资源分配效率,实验结果显示生成质量和控制精度均表现优异。

360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!

量子位
量子位 · 2025-03-02T12:33:05Z
炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

新加坡国立大学的MakeAnything项目利用Diffusion Transformer和非对称LoRA技术,实现高质量的程序化序列生成,解决了步骤逻辑、外观一致性和数据瓶颈等问题,展现出良好的泛化能力。

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

机器之心
机器之心 · 2025-02-15T11:54:19Z

文章讨论了对π0开源项目的期待与遗憾,分析了OpenVLA和CogACT的源码,重点介绍了动作预测模块的实现,包括ActionTokenizer类的功能和Diffusion Transformer的架构。通过对比不同模型,探讨如何改进VLA以接近π0的思路。

一文通透OpenVLA及其源码剖析——基于Prismatic VLM(SigLIP、DinoV2、Llama 2)及离散化动作预测

结构之法 算法之道
结构之法 算法之道 · 2025-01-11T14:25:54Z

本文介绍了Diffusion Transformer(DiT),一种用Transformer架构替代U-Net的神经网络,结合了视觉Transformer和扩散模型的优点。DiT在视频生成中调整模型结构以支持不同分辨率,并引入时间维度以保持一致性。研究者还探讨了类似的U-ViT架构,强调了Transformer在扩散模型中的潜力。

Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解)

结构之法 算法之道
结构之法 算法之道 · 2024-12-28T16:20:05Z
ViT在DDPM取代UNet(DiT)

本文探讨了用ViT替代DDPM中的UNet,提出了Diffusion Transformer-DiT模型。作者训练了四种不同大小的DiT模型,研究了补丁大小、变压器架构和模型规模。模型通过处理补丁序列进行操作,并在设计中加入去噪步数和类别标签,最终输出噪声预测和协方差。

ViT在DDPM取代UNet(DiT)

plus studio
plus studio · 2023-08-20T09:43:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码