该论文综述了针对大型语言模型的模型压缩技术,包括量化、修剪和知识蒸馏等方法。讨论了压缩后的大型语言模型的基准策略和评估指标,以提高效率和实际应用。为未来发展奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。