本研究提出了一种动态修剪词汇的方法,以提高大型语言模型的推理效率,解决了词汇量大带来的计算成本问题,同时保持模型性能。这一发现有望显著提升实际应用中的推理效率。
完成下面两步后,将自动完成登录并继续当前操作。