小红花·文摘

本文探讨了高效的图像处理技术，重点在于 Vision Transformer 模型的剪枝和加速方法。提出的 HeatViT 和 PPT 框架通过动态剪枝和汇聚技术显著降低计算成本，同时保持模型准确性。UP-ViTs 进一步压缩模型体积并提升性能，适用于目标检测等任务。这些方法在移动设备和 FPGA 上实现了实时执行，具有广泛的应用前景。

通过静态和动态修剪在 FPGA 上加速 ViT 推理

BriefGPT - AI 论文速递 ·

SparseByteNN是一种新颖的移动推理加速框架，通过利用细粒度的内核稀疏性实现实时执行和高准确性。实验结果表明，SparseByteNN相对于密集版本获得了1.27倍的加速，并相对于最先进的稀疏推理引擎MNN获得了1.29倍的加速，准确性略有下降。

SparseByteNN：一种基于细粒度分组稀疏性的新型移动推理加速框架

BriefGPT - AI 论文速递 ·