小红花·文摘

在变换器中生成和可视化上下文向量

MachineLearningMastery.com ·

本研究提出AEGIS框架，利用眼动追踪数据指导强化学习，帮助自主智能车辆识别关键兴趣区域。通过120万帧数据，模型成功预测人类注意力模式，提升决策能力。

AEGIS：基于人类注意力的智能车辆系统可解释指导

BriefGPT - AI 论文速递 ·

本研究探讨了变压器模型在迷宫任务中形成的因果世界模型，利用稀疏自编码器和注意力模式分析，揭示了模型构建及其因果作用，表明模型能够超越输入特征，增强对自发结构的理解。

使用因果世界模型的变压器在迷宫求解任务中的应用

BriefGPT - AI 论文速递 ·

本文探讨了语言模型在多步推理任务中是通过抄袭预训练语料库中记忆的答案还是通过多步推理机制来完成这些任务的疑问，并通过引入一种新的探测方法——机械化探测器，从模型的注意力模式中恢复推理树，分析了GPT-2和LLaMA在不同任务上的表现。结果表明，在许多情况下，语言模型确实在其架构中经历了一个多步推理的过程。

探索语言模型的多步推理能力的机械解释

BriefGPT - AI 论文速递 ·