本研究提出内核循环技术,解决GPU标记生成中的同步开销问题,结合层级融合与语言模型,实验结果显示可实现最高2.2倍的加速,具有重要应用价值。
本研究提出了HiRED标记丢弃方案,解决了高分辨率视觉-语言模型处理过多视觉标记的挑战,提高了标记生成的吞吐量并节省了计算资源。
完成下面两步后,将自动完成登录并继续当前操作。