BETA: 边缘二值化能效优化的 Transformer 加速器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文提出了ITA加速器架构,用于高效推理,表现出色的能效和面积效率。

🎯

关键要点

  • 提出了ITA加速器架构,用于高效推理。

  • ITA架构专注于Transformer模型和相关模型。

  • 利用8位量化和仅操作整数值的创新softmax实现低功耗和高效能。

  • ITA在能效上达到16.9 TOPS/W,表现出色。

  • 在面积效率方面,ITA在22纳米技术下达到每平方毫米5.93 TOPS/mm²的性能。

➡️

继续阅读