智谱AI开源了视频生成模型CogVideoX,该模型可生成高精度视频,已在国内获得好评。模型包含多个尺寸大小的模型,推理和微调所需的显存较小。智谱AI使用3D VAE视频压缩方法,结合了L2损失、LPIPS感知损失和3D判别器的GAN损失。智谱AI还提出了一种从图像字幕生成视频字幕的管道,并微调了视频字幕模型。智谱AI使用多个指标评估文本到视频生成的质量。未来,智谱AI将继续探索新型模型架构和更高效的视频压缩方法。
智谱AI发布了视频生成大模型「清影」,用户可以通过输入创意生成高精度视频。该模型擅长生成多种类型的视频内容,支持文字和图片生成视频。智谱AI表示,「清影」的生成能力将来可用于短视频制作、广告生成和电影剪辑等工作中。
完成下面两步后,将自动完成登录并继续当前操作。