BETA: 边缘二值化能效优化的 Transformer 加速器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了ITA加速器架构,用于高效推理,表现出色的能效和面积效率。
🎯
关键要点
-
提出了ITA加速器架构,用于高效推理。
-
ITA架构专注于Transformer模型和相关模型。
-
利用8位量化和仅操作整数值的创新softmax实现低功耗和高效能。
-
ITA在能效上达到16.9 TOPS/W,表现出色。
-
在面积效率方面,ITA在22纳米技术下达到每平方毫米5.93 TOPS/mm²的性能。
🏷️
标签
➡️