小红花·文摘

本文介绍了iLLaVA，一种可无缝部署于大型视觉语言模型的方法。iLLaVA通过合并冗余标记显著提高了吞吐量，提升近2倍，且对模型性能影响极小，仅下降0.2%-0.5%。该方法展示了强大的通用性和效率。