小红花·文摘

本论文重新审视了在线学习中的记忆排挤动态，并通过设计了一个简单直观的“重复增强排挤（RAR）”基线来解决欠拟合和过拟合问题。研究了重复和增强练习之间的相互作用，并应用强化学习（RL）来动态调整 RAR 的超参数，以平衡稳定性和可塑性。