联想变压器是一种稀疏表示学习器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种名为ITA的新型加速器架构,可用于高效推理Transformer模型和相关模型。该架构利用8位量化和一种仅操作整数值的创新softmax实现,实现了低功耗和高效能。ITA与最先进的Transformer加速器相媲美,达到了16.9 TOPS/W和每平方毫米5.93 TOPS/mm²的性能。
🎯
关键要点
- 该论文提出了一种名为ITA的新型加速器架构。
- ITA用于高效推理Transformer模型和相关模型。
- 该架构利用8位量化和仅操作整数值的创新softmax实现。
- ITA实现了低功耗和高效能。
- ITA在能效上与最先进的Transformer加速器相媲美,达到16.9 TOPS/W。
- 在面积效率方面,ITA在22纳米完全耗尽硅上绝缘体技术下,满足0.8 V时每平方毫米5.93 TOPS/mm²的性能。
🏷️
标签
➡️