小红花·文摘

本研究探讨深度神经网络的可解释性，提出从几何角度理解特征与数据分布的关系。结果表明，特征可分为上下文特征、成分特征和表面特征，为机制可解释性提供了新见解，并指引未来研究方向。

随机格上的表征学习

BriefGPT - AI 论文速递 ·

研究分析了神经网络流形的数学框架，探讨其在计算、自由度和学习能力方面的特点。引入了神经网络学习空间和深度流形空间的概念，揭示了学习过程中的瓶颈。通过几何视角，研究了深度学习的关键在于数据流形结构和概率分布，并提出了优化潜在空间中概率分布的方法。分析表明，神经网络的可学习性与流形的曲率、正则性及数据流形的体积密切相关。

深度流形第一部分：神经网络流形的剖析

BriefGPT - AI 论文速递 ·

本文从几何视角揭示了Transformer操作的内部机制，说明层归一化将潜在特征限制在超球面上，塑造单词的语义表示。通过探究GPT-2模型，发现了早期层中的清晰查询-键注意力模式，并构建了关于注意力头部的特定主题性的先前观察。利用这些洞察，将Transformer描述为沿着超球面的词粒子的轨迹的建模过程。

迷宫解决变形器中的结构化世界表示

BriefGPT - AI 论文速递 ·