火萤 AI-HPC:一种经济高效的软件-硬件协同设计用于深度学习
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文介绍了HotNAS框架,通过从预训练模型开始,以“热”状态启动搜索过程,缩短搜索时间。实验证明,在时间约束下,HotNAS生成的神经体系结构具有更高的精度。
🎯
关键要点
- 论文提出了HotNAS框架,通过预训练模型以“热”状态启动搜索过程。
- HotNAS将搜索时间从200 GPU小时缩短为不到3 GPU小时。
- 框架集成了硬件设计空间、神经体系结构搜索空间和压缩空间。
- 通过模型压缩创造新的减少延迟的机会,同时面临挑战。
- 实验表明,在5ms时间约束下,HotNAS生成的神经体系结构在精度上有显著提高。
➡️