单亲家庭:来自单一预训练基础模型的家庭成员光谱

📝

内容提要

本文介绍了一种新颖的渐进低秩分解(PLRD)方法,特别适用于大型语言模型的压缩。我们的方法利用预训练模型,然后通过逐步降低秩来将其解压缩为更小的尺寸。这种方法减少了计算开销和能源消耗,因为后续模型是基于原始模型而不需要重新训练。我们详细介绍了 PLRD 的实现方式,策略性地降低了张量秩,从而在模型性能和资源使用之间优化了权衡。通过大量实验展示了 PLRD 的有效性,表明使用 PLRD...

➡️

继续阅读