华为云官方博客 ·

了解基于模型的元学习：Learning to Learn优化策略和Meta-Learner LSTM

💡 原文中文，约7000字，阅读约需17分钟。

📝

内容提要

本文介绍了基于模型的元学习中的Learning to Learn优化策略和Meta-Learner LSTM。Meta-Learner LSTM使用单元状态表示Learner参数的更新，既能发现一个良好的Learner初始化参数，又能将Learner的参数更新到一个给定的小训练集，以完成一些新任务。Meta-Learner LSTM和MAML的区别在于信息交流的时间点和元学习器的更新方式。Meta-Learner LSTM适用于LSTM结构的元学习器，但基学习器可以适用于任意模型结构。在miniImageNet上进行分类，Meta-Learner LSTM取得了较好的结果。

🎯

关键要点

本文介绍了基于模型的元学习中的Learning to Learn优化策略和Meta-Learner LSTM。
Meta-Learner LSTM使用单元状态表示Learner参数的更新，能够发现良好的Learner初始化参数。
Meta-Learner LSTM与MAML的区别在于信息交流的时间点和元学习器的更新方式。
Meta-Learner LSTM适用于LSTM结构的元学习器，基学习器可以适用于任意模型结构。
在miniImageNet上进行分类，Meta-Learner LSTM取得了较好的结果。
Learning to Learn提出了一种用LSTM替代传统优化方法的全新优化策略。
优化器通过学习的梯度更新规则替代人为设定的更新规则。
Meta-Learner LSTM通过梯度下降更新规则和LSTM单元状态更新规则的等价性进行参数更新。
Meta-Learner LSTM的设计思路是学习LSTM的更新规则并应用于Learner的参数更新。
Meta-Learner LSTM的算法流程包括随机抽取数据集、计算损失函数和更新参数。
Meta-Learner LSTM模型结构为两层LSTM网络，第一层为正常LSTM，第二层为近似随机梯度的LSTM。
Meta-Learner LSTM与MAML的主要区别在于参数更新和信息交流的方式。

🏷️

了解基于模型的元学习：Learning to Learn优化策略和Meta-Learner LSTM

内容提要

关键要点

标签

继续阅读