小红花·文摘

Apple Machine Learning Research ·

本研究分析了视觉-语言模型(VLM)的内部表示，发现相似任务的向量表示具有相似性，且示例与指令的结合能够增强任务表示，揭示了模型的工作机制。

BriefGPT - AI 论文速递 ·

本研究在国际象棋领域中扩展了语言模型的工作，通过训练和研究模型的内部表示，发现该模型具有棋盘状态的内部表示，并提升了模型的胜率。

BriefGPT - AI 论文速递 ·

本文比较和描述了神经网络结构在几何和拓扑方面的内部表示和层间数据流动的动态变化，并通过实验为可解释的AI的发展做出了贡献。

BriefGPT - AI 论文速递 ·

本文介绍了CALM实验框架，使用梯度基于对抗攻击的方法对语言模型的内部表示进行破坏性实验。通过对BERT等语言模型执行对应关系提示任务的案例研究，发现语言模型的表示高度交织在一起，但可以对其在最常被利用的任务方面进行有意义的解释。

BriefGPT - AI 论文速递 ·