本研究探讨大型语言模型在角色理解任务中的逐字记忆问题,并提出减轻机械记忆影响的方法。结果显示,模型在虚构作品中的记忆性能从96%降至72%,角色理解任务的准确率降低了18%。
研究发现大型语言模型需要大量重复才能进行逐字记忆,后期的检查点更有可能逐字记忆序列。压力测试发现遗忘方法无法移除逐字记忆的信息,且会降低语言模型质量。这些发现挑战了逐字记忆源自特定模型权重或机制的假设,隔离和阻止逐字记忆将非常困难。
完成下面两步后,将自动完成登录并继续当前操作。