小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种扩展的图像扩散模型,能够联合训练图像和视频数据,生成高保真度的时空视频。通过改进的有条件采样技术,该模型在文本条件视频生成和视频预测方面取得了先进成果,并展示了高分辨率视频生成和动态三维物体的视频生成的有效性和优越性。

HARIVO:利用文本到图像模型生成视频

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究提出了一种基于去噪扩散概率模型的视频建模框架,能够生成长达25分钟的高质量视频。通过引入多种文本条件,扩展了文本驱动视频生成的能力,并提出了新的自我关注计算方式和语义运动预测模块,显著提升了视频生成效果。此外,研究探讨了低质量视频训练高质量模型的可行性,取得了显著成果。

FreeLong: 无需训练的长视频生成与 SpectralBlend 时域注意力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z
Sora技术报告 视频生成模型作为世界模拟器 笔记

Sora技术报告介绍了OpenAI在视频生成模型方面的研究,利用文本条件扩散模型生成高保真视频。该模型采用时空补丁和变压器架构,能够生成不同分辨率和时长的视频,展现了在物理世界模拟中的潜力。同时,Sora还具备图像生成、视频编辑和与现实世界互动的能力,但仍存在一些局限性。

Sora技术报告 视频生成模型作为世界模拟器 笔记

plus studio
plus studio · 2024-02-16T17:55:00Z
视频生成模型:构建虚拟世界的模拟器 [译]

该文章介绍了一种基于文本条件的扩散模型,用于生成不同特征的视频和图像。模型采用了Transformer架构,并通过压缩视频数据和提取时空补片进行训练。研究结果显示,该模型是实现模拟物理世界的通用工具的有前途的一步。文章还介绍了Sora模型的能力和局限性,并探讨了视频模型的发展前景。

视频生成模型:构建虚拟世界的模拟器 [译]

宝玉的分享
宝玉的分享 · 2024-02-15T20:10:00Z
视频生成模型作为世界模拟器

我们研究了在视频数据上大规模训练生成模型。通过联合训练文本条件扩散模型,我们的最大模型Sora能够生成高保真度的一分钟视频。这表明,扩展视频生成模型是构建通用物理世界模拟器的有前景的途径。

视频生成模型作为世界模拟器

OpenAI
OpenAI · 2024-02-15T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码