本文介绍了iLLaVA,一种可无缝部署于大型视觉语言模型的方法。iLLaVA通过合并冗余标记显著提高了吞吐量,提升近2倍,且对模型性能影响极小,仅下降0.2%-0.5%。该方法展示了强大的通用性和效率。
完成下面两步后,将自动完成登录并继续当前操作。