PLPHP:用于高效大型视觉语言模型的每层每头视觉标记修剪
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法——每层每头视觉标记修剪(PLPHP),旨在提高大型视觉语言模型的推理效率。该方法通过动态调整视觉标记保留率,显著提升解码速度18%,减少缓存大小,同时保持较小的性能损失。
🎯
关键要点
- 本研究提出了一种新方法——每层每头视觉标记修剪(PLPHP)。
- 该方法旨在提高大型视觉语言模型的推理效率。
- PLPHP通过动态调整每层的视觉标记保留率和在注意力头级别进行修剪。
- 实验结果显示,解码速度提高了18%,同时减少了缓存大小。
- 该方法在保持较小性能损失的情况下显著提升了解码速度。
➡️