STAR:模型合并的光谱截断与重缩放

📝

内容提要

本研究解决了模型合并过程中由于模型数量增加而导致的任务性能下降问题。提出的光谱截断与重缩放方法(STAR)通过去掉光谱空间中的小成分并自动重新缩放参数,显著提升了合并模型的性能。研究表明,在合并 12 个模型时,STAR 方法在 Flan-T5 上的性能提升达 4.2%。

➡️

继续阅读