迷途小书童 ·

快手可灵文生视频大模型

💡 原文中文，约800字，阅读约需2分钟。

📝

内容提要

快手推出了名为可灵AI的视频生成模型，具有高效的训练基础设施和可扩展的基础架构。该模型能够生成长达2分钟、帧率达30fps的视频，采用3D时空联合注意力机制，能够建模复杂时空运动，生成较大幅度运动的视频内容。可灵AI还能模拟真实世界的物理特性，生成符合物理规律的视频。用户可以通过申请试用来体验该模型。

🎯

关键要点

快手推出了名为可灵AI的视频生成模型，功能与OpenAI的SORA相媲美。
可灵AI具有高效的训练基础设施和可扩展的基础架构，能够生成长达2分钟、帧率达30fps的视频。
采用3D时空联合注意力机制，能够建模复杂时空运动，生成符合运动规律的视频内容。
可灵AI能够模拟真实世界的物理特性，生成符合物理规律的视频。
基于对文本-视频语义的理解和Diffusion Transformer架构，能够将用户的想象力转化为具体画面。
可灵AI能够生成1080p分辨率的电影级视频，呈现宏大场景和细腻特写。
采用可变分辨率的训练策略，满足多种视频宽高比的需求。
试用申请需通过应用商店下载快影app并填写问卷，等待官方核实。

🏷️

快手可灵文生视频大模型

内容提要

关键要点

标签

继续阅读