本文介绍了一种新的压缩大型语言模型(LLM)的方法,通过使用精确的提示信息作为输入来提高压缩模型的预测准确性,以平衡准确性和效率。研究表明,通过这种提示学习方法,压缩LLMs能够匹配或超过原模型的准确性,为LLMs的推断和扩展提供了新的可能性。
完成下面两步后,将自动完成登录并继续当前操作。