小红花·文摘

本文介绍了一种新的压缩大型语言模型（LLM）的方法，通过使用精确的提示信息作为输入来提高压缩模型的预测准确性，以平衡准确性和效率。研究表明，通过这种提示学习方法，压缩LLMs能够匹配或超过原模型的准确性，为LLMs的推断和扩展提供了新的可能性。