小红花·文摘

机器之心 ·

该研究探讨了基于Transformer的扩散模型在图像和视频生成中的应用，介绍了新模型GenTron和Latte，并展示了在视频生成和文本到视频生成任务中的显著性能提升。此外，研究提出了高效的部署策略和新颖的生成方法，显示了扩散模型在自动驾驶和复杂视频场景中的潜力。

BriefGPT - AI 论文速递 ·