BriefGPT - AI 论文速递 ·

并非所有语言模型特征都是线性的

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文研究了大型语言模型（LLMs）中高层语义概念的线性表示，分析了不同模型（如ELMO、BERT、XLM-R等）中的语言特征编码。研究发现，低维子空间能够通过稀疏线性组合建模激活，LLMs在空间和时间维度上学习了结构化知识，支持其形成世界模型。

🎯

❓

高层语义概念在大型语言模型中按线性方式编码，研究表明这种线性表示的起源与下一个标记预测目标和梯度下降的隐式偏差有关。

低维子空间编码了各种语言特征，包括结构化依赖关系，并且子空间之间存在层次关系，可以用于细粒度操作。

语言模型中的激活可以被建模为输入文本特征的稀疏线性组合，这种方法有助于重构特征方向并提高模型的透明度和可操控性。

多语言语言模型在维持共享多语言表示空间的同时，能够编码语言敏感信息，并沿着语言敏感和语言中性轴提取特征。

多尺度变压器语言模型在内存效率、计算时间和困惑度方面具有优势，能够有效处理多种任务。

大型语言模型在多个尺度上学习空间和时间的线性表示，能够可靠地编码空间和时间坐标，形成对世界的模型。

🏷️