小红花·文摘

本研究探讨了语言模型代理在自主体应用中的目标遵循问题，并提出了分析目标漂移的新方法。尽管最佳代理在困难评估中表现良好，但所有模型均显示出目标漂移，且与上下文长度增加的模式匹配敏感性相关。