小红花·文摘

本文提出了一种新的计算模型，通过内存网络的检索错误来估计惊喜的新颖性，并通过惊喜记忆（SM）增加基于惊喜的内在动机的能力。实验结果表明，SM在稀疏奖励环境中表现出高效的探索行为，并显著提升了最终性能。