SHOT: 抑制优化轨迹上的 Hessian 对于基于梯度的元学习
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为SHOT的算法,可用于最小化目标模型和参考模型参数之间的距离。该算法适用于任何GBML基线,并已证明其优于对应基线的结果。
🎯
关键要点
- 本文提出了一种名为SHOT的算法,旨在最小化目标模型和参考模型参数之间的距离。
- SHOT算法假设基于梯度的元学习在内循环中隐式地压抑了海森矩阵。
- 该算法适用于任何GBML基线,并且对算法和体系结构是不可知的,具有广泛的适用性。
- 尽管处理了高阶项,SHOT并未显著增加基线模型的计算复杂度。
- 通过在标准的少样本学习任务上进行实证测试,验证了SHOT的有效性,并展示了其优于对应基线的结果。
➡️