小红花·文摘

研究发现大型语言模型中神经元与特征对应关系不清晰，使用玩具模型观察到了特征叠加现象，可以实现超出线性模型的压缩，但需要非线性滤波的干扰。目前还不清楚如何将其推广到真实网络。