本论文重新审视了在线学习中的记忆排挤动态,并通过设计了一个简单直观的“重复增强排挤(RAR)”基线来解决欠拟合和过拟合问题。研究了重复和增强练习之间的相互作用,并应用强化学习(RL)来动态调整 RAR 的超参数,以平衡稳定性和可塑性。
完成下面两步后,将自动完成登录并继续当前操作。