小红花·文摘

该论文提出了 UP-ViTs 统一结构修剪框架，旨在压缩 Vision Transformer 模型体积并提高准确性。通过稀疏输入令牌和软剪枝，显著降低计算成本，适用于移动设备和 FPGA。同时，研究提出了多种高效的压缩技术，如 HeatViT 和 NViT，优化了模型性能和资源利用，确保在保持精度的同时实现更高的计算效率。