JAQ: Joint Efficient Architecture Design and Low-Bit Quantization through Hardware-Software Co-Exploration
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出JAQ框架,解决资源受限边缘设备上神经网络架构与硬件加速器的联合设计问题。JAQ通过通道稀疏量化和BatchTile方法显著减少内存开销,加速硬件搜索。在ImageNet上的实验表明,Top-1准确率提高约7%,硬件搜索时间降至0.15秒。
🎯
关键要点
- 本研究提出JAQ框架,旨在解决资源受限边缘设备上神经网络架构与硬件加速器的联合设计问题。
- JAQ框架通过通道稀疏量化和BatchTile方法显著减少内存开销。
- JAQ框架加速了硬件搜索,实验结果显示在ImageNet上的Top-1准确率提高约7%。
- 硬件搜索时间降至0.15秒,提升了设计效率。
➡️