使用高性能计算和量子退火预测深度学习模型的超参数优化性能

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种利用标准频率回归模型通过网络架构、超参数和时间序列验证性能数据来预测部分训练模型配置的最终性能的方法,并证明该方法在视觉分类和语言建模领域中是有效的。同时,我们提出了一种早期停止方法,可用于超参数优化和元模建模,加速了模型配置的优化过程,该方法在强化学习-based架构选择算法和基于贝叶斯思想的搜索方法中均可无缝集成。

🎯

关键要点

  • 提出了一种利用标准频率回归模型的方法来预测部分训练模型配置的最终性能。

  • 该方法在视觉分类和语言建模领域中被证明是有效的。

  • 提出了一种早期停止方法,用于超参数优化和元模建模。

  • 早期停止方法加速了模型配置的优化过程。

  • 该方法可以无缝集成到强化学习-based架构选择算法和基于贝叶斯思想的搜索方法中。

➡️

继续阅读