MADTP:多模态对齐引导的动态标记修剪加速视觉 - 语言转换器
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本论文介绍了LTMP学习阈值符号合并和修剪方法,通过动态确定合并和修剪的符号,降低计算视觉变换器所需的输入符号数量,实现了在降低速率的同时保持最先进的准确性,比先前的方法快一个数量级以上。
🎯
关键要点
- 论文介绍了LTMP学习阈值符号合并和修剪方法。
- 该方法通过动态确定合并和修剪的符号,降低计算视觉变换器所需的输入符号数量。
- 在降低速率的同时,LTMP方法保持了最先进的准确性。
- 与先前的方法相比,LTMP在仅一个微调阶段的情况下速度快了一个数量级以上。
➡️