本文探讨了大型语言模型(LLMs)的可靠性,指出其在不同任务间的“真理几何”无法转移。研究发现,线性分类器在不同任务上的相似性较低,激活向量在任务间形成明显分离的聚类,复杂方法未能解决这一限制。
完成下面两步后,将自动完成登录并继续当前操作。