BriefGPT - AI 论文速递 ·

来自fMRI的证据支持语言模型中的两阶段抽象过程

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文探讨了深度语言模型（DLMs）与人脑语言处理机制的关系。研究表明，DLMs的层次结构能够模拟人脑语言理解的动态过程，且信息逐层累积与大脑神经活动存在镜像关系。大型语言模型（LLMs）性能提升后，其在预测神经响应时与大脑的相似性增强，揭示了二者在语言处理上的融合特征，为未来模型开发提供新方向。

🎯

❓

DLMs的层次结构能够模拟人脑语言理解的动态过程，信息逐层累积与大脑神经活动存在镜像关系。

随着LLMs性能的提升，它们在预测神经响应时与大脑的相似性增强，显示出二者在语言处理上的融合特征。

DLMs的激活可以分解为词汇、组合、句法和语义表示，其中组合表示更广泛地招募大脑皮层网络。

心理可信模型在多种背景下表现更优，尤其是在融合具象信息的情况下，对大脑活动预测表现最佳。

DLMs使用分层连续数值向量表示单词和上下文，与传统心理语言学模型不同，产生了新兴应用，如人类般的文本生成。

研究通过高时序分辨率的电皮层图谱数据记录参与者的神经活动，并将相同叙述输入DLM中，提取不同层的上下文嵌入进行预测。

🏷️