一分钟读论文:《元认知记忆策略优化》
📝
内容提要
中国科学技术大学、浙江大学和腾讯合作的一篇论文《Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents》,针对长上下文记忆中的信息衰减问题,提出了基于元认知信念熵的MMPO算法,在175万token的超长上下文下保持97.1%的性能,显著优于现有递归总结方法。
➡️