研究发现大型语言模型中神经元与特征对应关系不清晰,使用玩具模型观察到了特征叠加现象,可以实现超出线性模型的压缩,但需要非线性滤波的干扰。目前还不清楚如何将其推广到真实网络。
完成下面两步后,将自动完成登录并继续当前操作。