HiRED:基于注意力的标记丢弃方法以实现资源受限环境下高分辨率视觉-语言模型的高效推理
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了HiRED标记丢弃方案,解决了高分辨率视觉-语言模型处理过多视觉标记的挑战,提高了标记生成的吞吐量并节省了计算资源。
🎯
关键要点
- 本研究提出了HiRED标记丢弃方案。
- HiRED旨在解决高分辨率视觉-语言模型在资源受限环境下处理过多视觉标记的挑战。
- 该方案利用视觉编码器的注意力机制智能选择和丢弃不必要的标记。
- 实验证明HiRED显著提高了标记生成的吞吐量。
- HiRED在保持高准确度的同时节省了计算资源。
➡️