小红花·文摘

本研究提出了MAPS框架，全面映射大型语言模型中注意力头的功能，填补了以往仅关注推理行为的研究空白。通过评估20种操作和6种流行的LLM，MAPS的推断结果与输出高度相关，揭示了未充分研究的操作及其普遍性和架构偏差。