小红花·文摘 - 小红花技术领袖俱乐部

本研究通过引入Absorb和Decompose操作，解决了大型模型适应中的冗余问题，显著提升了LLaMA-2-7B的微调性能，提供了高效稳定的微调策略。

CLOVER: 使用正交向量的约束学习以消除冗余

BriefGPT - AI 论文速递 ·

本研究探讨了稀疏自编码器（SAE）在解释引导向量时的问题，发现其不适用于引导向量的输入分布，导致误导性分解，限制了有效性。

Can Sparse Autoencoders Be Used to Decompose and Interpret Steering Vectors?

BriefGPT - AI 论文速递 ·