本研究提出了一种动态压缩提示(LLM-DCP)的方法,旨在降低大型语言模型推理中的计算成本和性能限制。该方法有效减少了提示标记数量,同时保持模型性能,实验结果表明其在高压缩率下优于现有技术,具有良好的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。