该论文提出了 UP-ViTs 统一结构修剪框架,旨在压缩 Vision Transformer 模型体积并提高准确性。通过稀疏输入令牌和软剪枝,显著降低计算成本,适用于移动设备和 FPGA。同时,研究提出了多种高效的压缩技术,如 HeatViT 和 NViT,优化了模型性能和资源利用,确保在保持精度的同时实现更高的计算效率。
完成下面两步后,将自动完成登录并继续当前操作。