实时互动网 ·

ControlVideo：单镜头文本驱动的视频编辑 | 清华大学朱军团队

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

本文提出的ControlVideo模型实现了文本驱动的视频编辑，确保内容的忠实性和时间的一致性。通过引入条件控制信息和改进注意力机制，ControlVideo能够处理140帧视频，显著提升编辑效果和一致性，优于现有方法。

🎯

❓

ControlVideo模型实现了文本驱动的视频编辑，确保内容的忠实性和时间的一致性。

ControlVideo通过引入条件控制信息和改进注意力机制来提升长视频间的一致性。

ControlVideo在视频编辑的三个目标上表现更优，能够处理140帧视频，显著高于以往方法的可处理帧数。

ControlVideo通过引入Lora层学习参考图像的概念，增强视频与参考图像的对齐能力。

分段生成策略解决了显存限制问题，并增强了相邻片段间的一致性。

实验结果显示，ControlVideo能够根据不同控制条件完成多种编辑场景，并保持时间一致性。

🏷️

洪绘视频整理发布！快速整理视频文件名、移动文件夹工具
该应用主要用于个人视频整理，支持通过标签命名和快速修改文件名。用户可以将下载的视频集中到一个文件夹，方便管理和搜索。软件界面简洁，支持视频预览和文件操作，...
开源社区“内战”爆发：Bun 创始人预言“未来将禁止人类贡献”，硅谷大佬纷纷站队！
本文永久链接 – https://tonybai.com/2026/05/01/open-source-civil-war-bun-founder-pre...
在Kubernetes中管理Valkey集群
Percona推出Valkey Operator，支持在Kubernetes中管理Valkey数据库。新功能包括配置参数、用户权限管理和TLS加密支持，用...
The craziest part of Musk v. Altman happened while the jury was out of the room
Okay, I am not a lawyer so I only understood about half of what just happened...
网友吐槽：OpenClaw又触发了Claude Code当场翻脸还扣钱！
Claude Code因关键词“openclaw”触发机制，导致用户请求被拒绝并扣费。开发者发现系统未能理解上下文，简单匹配关键词造成误伤，引发社区讨论。...
Christophe Pettus: On pgvectorscale, and Hybrid Search Without an Elasticsearch Sidecar
pgvector is excellent. It is also, at large scale, expensive — because the HN...