晓飞的算法工程笔记 ·

ToCom：一次训练随意使用，华为提出通用的ViT标记压缩器 | ECCV 2024 - 晓飞的算法工程笔记

💡 原文中文，约8100字，阅读约需20分钟。

📝

内容提要

本文介绍了标记补偿器（ToCom）的方法，解决了标记压缩在训练和推理阶段压缩程度不匹配导致的性能下降问题。ToCom通过自蒸馏训练在预训练模型上描述不同压缩程度下模型之间的差距。在推理过程中，ToCom可以直接插入到下游现成模型中，提高模型性能。实验结果表明，ToCom能够有效解耦训练和推理过程中的标记压缩程度，并提高标记压缩性能。

🎯

关键要点

标记压缩通过减少冗余标记数量来加快视觉变换器的训练和推理。
训练和推理阶段的压缩程度不匹配会导致模型性能下降。
提出标记补偿器（ToCom）以解耦训练和推理过程中的标记压缩程度。
ToCom通过自蒸馏训练在预训练模型上描述不同压缩程度下模型之间的差距。
ToCom可以直接插入到下游现成模型中，提高模型性能，无需进一步训练。
实验结果表明，ToCom能够有效解耦训练和推理过程中的标记压缩程度。
标记压缩方法具有明显的优势，能够以零样本方式应用于现成模型。
不同源压缩程度下训练的模型之间存在差距，影响迁移效果。
ToCom是一个参数高效的模块，能够通过少量参数描述不同压缩程度的模型差距。
ToCom的训练整合为ViT主干的预训练阶段的扩展，增强其泛化能力。

🏷️

继续阅读

笔记 #732
文章主要讲述了Harper Reed于2026年4月28日在涩谷Club Quattro观看Napalm Death演出的经历。
笔记 #731
文章讨论了Merzbow在涩谷Club Quattro的演出，强调这是一次重要的音乐活动，吸引了众多关注。
笔记 #730
文章讨论了Harper Reed于2026年4月28日在涩谷Club Quattro的演出“Growl of Clown”。
Figma to Qt 1.0 发布：将您的设计从 Figma 带到设备的最可靠方式
Figma to Qt 是一款插件，旨在确保设计从 Figma 到设备的过程不受损失。它允许设计师在 Figma 内部直接准备和预览 GUI 设计，避免开...
扩展项目的SDK风格支持
从Visual Studio 18.5开始，用户可以使用SDK风格项目创建和构建VSIX扩展。这一更新提高了增量构建性能，最多可减少75%的构建时间。新项...
Warp的赌注：开源以对抗闭源竞争对手
Warp，一个基于Rust的开发环境，宣布其客户端开源，旨在通过社区合作加速产品开发。公司认为AI辅助开发将改变软件构建方式，强调开放性和可定制性，以应对市场竞争。

ToCom：一次训练随意使用，华为提出通用的ViT标记压缩器 | ECCV 2024 - 晓飞的算法工程笔记

内容提要

关键要点

标签

继续阅读