本文介绍了一种名为VidTok的开源视频标记器,旨在解决视频生成和理解中的像素级冗余问题。VidTok结合了卷积层和缩放模块等架构改进,并采用有限标量量化技术,显著提升了性能,优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。