PLPHP:用于高效大型视觉语言模型的每层每头视觉标记修剪

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方法——每层每头视觉标记修剪(PLPHP),旨在提高大型视觉语言模型的推理效率。该方法通过动态调整视觉标记保留率,显著提升解码速度18%,减少缓存大小,同时保持较小的性能损失。

🎯

关键要点

  • 本研究提出了一种新方法——每层每头视觉标记修剪(PLPHP)。
  • 该方法旨在提高大型视觉语言模型的推理效率。
  • PLPHP通过动态调整每层的视觉标记保留率和在注意力头级别进行修剪。
  • 实验结果显示,解码速度提高了18%,同时减少了缓存大小。
  • 该方法在保持较小性能损失的情况下显著提升了解码速度。
➡️

继续阅读