小红花·文摘

电影感，不再需要大团队：Veo 视频生成 API，把镜头语言交给 AI（含超多示例与图例）

静觅 ·

本文介绍了如何使用ComfyUI生成视频，包括下载模型、加载工作流和设置参数。分为文生视频和图生视频两种类型，提供了具体的命令和步骤，帮助用户实现视频生成。

美团开源视频生成模型LongCat-Video，兼具文生视频/图生视频/视频续写三大能力，媲美开闭源顶尖模型

HyperAI超神经 ·

智象未来推出全球首个开放使用的DiT模型，依托商汤强大的AI基础设施，实现快速模型迭代。该模型高效、灵活、稳定，广泛应用于影视和教育领域，推动文生视频技术发展。

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

量子位 ·

多模态生成大模型能够同时生成多种数据形式，尤其是文生视频模型如HunyuanVideo和Wan2.1，通过深度学习架构提升视频生成质量，广泛应用于创意产业，推动AI发展。

Wan2.1和HunyuanVideo文生视频模型算法解析与功能体验丨前沿多模态模型开发与应用实战第六期

百度大脑 ·

Adobe于2月12日发布了Firefly文生视频AI模型，支持文本和图像生成视频，目前处于Beta测试阶段。Apple TV应用已上线Android平台，用户可访问Apple TV+内容。腾讯翻译君将于3月13日停止运营，功能迁移至腾讯元宝。谷歌Chrome新增的自动改密功能被指为AI炒作。OpenAI计划推出GPT-4.5，并推进模型整合。

派早报：Adobe 发布 Adobe Firefly 文生视频 AI 模型等

少数派 ·

白日梦AI-轻松将文字转成视频

文武科技柜 ·

本文介绍了一款强大的AI工具，支持文生视频、图生视频和音乐生成，适用于极空间NAS的部署。文章详细说明了部署步骤和设置方法，并强调用户需自备API Key。

想玩AI？用极空间部署这个就够了，一个项目解决文、画、视、听所有需求

熊猫不是猫QAQ ·

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

机器之心 ·

阿里通义将在云栖大会期间发布视频生成大模型，包含文生视频和图生视频两种创作模式，具备强大的画面视觉动态生成能力，支持多语言和适配多种规格比例的视频。

阿里通义将发布视频生成大模型，预约页面已上线

量子位 ·

本文对四个国产Sora进行了全方位评测，分为图生视频和文生视频两个赛道，评测结果显示可灵在生成墨镜方面胜出，PixVerse V2在生成末日场景方面胜出，Vidu在生成老照片方面表现较好。在文生视频中，各选手都有特点但存在问题。Vidu生成速度最快，清影的速度高于其他两位。综合来看，目前无法判定哪个国产Sora最强。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

量子位 ·

华为云开发者大会2024推出了HarmonyOS、盘古大模型、昇腾AI云服务、GaussDB数据库等创新成果。华为云技术专家和开发者代表在线上分享了云原生应用稳定性、文生视频技术、数据库应用痛点和AI原生应用引擎等内容。华为云开发者联盟愿与开发者们继续合作，推动技术创新。

敢叫印钞机加速器的AI，你确定不来试试？

迷途小书童 ·

本文介绍了Open-Sora 1.1的视频生成效果和体验方法。Open-Sora是一个开源解决方案，可生成2s~15s，144p到720p分辨率的视频，支持文本到图像、文本到视频和图像到视频的生成。用户可以通过运行代码和模型来体验Open-Sora 1.1的视频生成效果。

自OpenAI推出Sora以来备受关注的文生视频概念及应用。DiT是一个文生图模型，将U-Net架构替换为Transformer架构。上海人工智能实验室开源了全球首个文生视频DiT：Latte，可自由部署。Latte通过预训练的变分自编码器将视频编码为特征，并利用Transformer结构进行编码和解码，生成连续、逼真的视频内容。Latte的研发团队与中央广播电视总台合作推出了中国原创文生视频动画。文生视频应用有望加速落地，推动影视行业的革命性发展。

在线教程丨与 Sora 技术路线相似！全球首个开源文生视频 DiT 模型 Latte 一键部署

HyperAI超神经 ·

OpenAI的首个视频生成模型sora引发了对文生图和文生视频的热情。清华大学团队推出了Latent Consistency Models (LCM)，通过解决潜在空间中的概率流ODE，实现了快速的一步生成。LCM-LoRA是LCM的一种快速、无需训练的推理方法。Stable Diffusion XL Turbo是一种新一代图像合成模型，能够实时响应并生成图像。SDXL使用对抗扩散蒸馏技术，在1-4步内高效采样大规模基础图像扩散模型。

文生图的最新进展：从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning

结构之法算法之道 ·

OpenAI的文生视频利用transformer架构生成高保真视频，具有控制视频大小和执行图像和视频编辑任务的能力。模型展现了模拟物理世界的能力。虽然目前仅对个别人开放，但未来全民开放只是时间问题。

炸裂的文字生成视频sora 背后的技术逻辑

dotNET跨平台 ·

Claude Desktop 对接通义万相 Wan MCP

电影感，不再需要大团队：Veo 视频生成 API，把镜头语言交给 AI（含超多示例与图例）

ComfyUI Wan2.2 视频生成示例