QoS-Nets: Adaptive Approximate Neural Network Inference

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种灵活重用近似乘法器的方法,解决神经网络运行时算力资源消耗波动的问题。通过搜索算法,系统可选择合适的近似乘法器子集并再训练,以优化性能,动态调整服务质量。

🎯

关键要点

  • 本研究提出了一种灵活重用近似乘法器的方法。
  • 该方法解决了神经网络应用运行时算力资源消耗变动的问题。
  • 引入了一种搜索算法,根据用户定义的大小选择适当的近似乘法器子集。
  • 通过再训练优化任务性能,以适应环境条件变化。
  • 系统能够动态调整服务质量。
➡️

继续阅读