💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
Wan-2.1-1.3b是由Wan-Video维护的先进视频生成模型,能够根据文本描述生成5秒480p的视频。该模型采用扩散变换器架构,支持中英文输入,具备良好的视觉质量和运动连贯性,用户可调整参数以控制生成过程。
🎯
关键要点
- Wan-2.1-1.3b是由Wan-Video维护的先进视频生成模型。
- 该模型能够根据文本描述生成5秒480p的视频。
- 模型采用扩散变换器架构,结合新颖的时空变分自编码器。
- 与其他模型相比,Wan-2.1-1.3b在视觉质量和运动连贯性方面表现优越。
- 支持中英文输入,用户可调整参数以控制生成过程。
- 输入包括文本提示、宽高比、帧数、分辨率、采样参数和种子值。
- 输出为5秒的480p MP4视频,并提供直接链接访问生成内容。
❓
延伸问答
Wan-2.1-1.3b模型的主要功能是什么?
Wan-2.1-1.3b模型能够根据文本描述生成5秒480p的视频。
Wan-2.1-1.3b模型使用了什么样的架构?
该模型采用扩散变换器架构,结合新颖的时空变分自编码器。
用户如何控制Wan-2.1-1.3b模型的生成过程?
用户可以调整文本提示、宽高比、帧数、分辨率、采样参数和种子值来控制生成过程。
Wan-2.1-1.3b模型支持哪些语言输入?
该模型支持中英文输入。
Wan-2.1-1.3b与其他视频生成模型相比有什么优势?
Wan-2.1-1.3b在视觉质量和运动连贯性方面表现优越。
Wan-2.1-1.3b模型生成的视频格式是什么?
输出为5秒的480p MP4视频,并提供直接链接访问生成内容。
➡️