小红花·文摘

本文介绍了针对大型语言模型的优化方法，包括基于梯度的模型修剪、低秩投影和稀疏性策略。这些方法提高了预训练和推理效率，降低了内存需求，同时保持高准确率。研究展示了在普通硬件上实现高效微调和推理的可行性。