全球指导的压缩:无训练高分辨率多模态大语言模型加速
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新型令牌压缩方法GlobalCom$^2$,旨在提升多模态大语言模型的推理效率。该方法通过优化保留比率,消除冗余令牌,适应性保留重要细节,实验结果表明其在性能和效率上优于现有方法。
🎯
关键要点
- 本研究提出了一种新型令牌压缩方法GlobalCom$^2$。
- 该方法旨在提升多模态大语言模型的推理效率。
- GlobalCom$^2$专为处理高分辨率图像的多模态大语言模型设计。
- 通过优化保留比率,消除冗余令牌,适应性保留重要细节。
- 实验结果表明GlobalCom$^2$在性能和效率上优于现有方法。
➡️