SHOT: 抑制优化轨迹上的 Hessian 对于基于梯度的元学习

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一种名为SHOT的算法,可用于最小化目标模型和参考模型参数之间的距离。该算法适用于任何GBML基线,并已证明其优于对应基线的结果。

🎯

关键要点

  • 本文提出了一种名为SHOT的算法,旨在最小化目标模型和参考模型参数之间的距离。
  • SHOT算法假设基于梯度的元学习在内循环中隐式地压抑了海森矩阵。
  • 该算法适用于任何GBML基线,并且对算法和体系结构是不可知的,具有广泛的适用性。
  • 尽管处理了高阶项,SHOT并未显著增加基线模型的计算复杂度。
  • 通过在标准的少样本学习任务上进行实证测试,验证了SHOT的有效性,并展示了其优于对应基线的结果。
➡️

继续阅读