跨越前进:通过 JumpReLU 稀疏自编码器提高重建保真度
📝
内容提要
通过在语言模型(LM)激活中使用 JumpReLU SAEs,本文在给定的稀疏度水平上实现了与其他最新进展(如 Gated 和 TopK SAEs)相比更高的重构准确性,并证明了这种改进不会损害解释性。
➡️
通过在语言模型(LM)激活中使用 JumpReLU SAEs,本文在给定的稀疏度水平上实现了与其他最新进展(如 Gated 和 TopK SAEs)相比更高的重构准确性,并证明了这种改进不会损害解释性。