联想变压器是一种稀疏表示学习器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文提出了一种名为ITA的新型加速器架构,可用于高效推理Transformer模型和相关模型。该架构利用8位量化和一种仅操作整数值的创新softmax实现,实现了低功耗和高效能。ITA与最先进的Transformer加速器相媲美,达到了16.9 TOPS/W和每平方毫米5.93 TOPS/mm²的性能。

🎯

关键要点

  • 该论文提出了一种名为ITA的新型加速器架构。
  • ITA用于高效推理Transformer模型和相关模型。
  • 该架构利用8位量化和仅操作整数值的创新softmax实现。
  • ITA实现了低功耗和高效能。
  • ITA在能效上与最先进的Transformer加速器相媲美,达到16.9 TOPS/W。
  • 在面积效率方面,ITA在22纳米完全耗尽硅上绝缘体技术下,满足0.8 V时每平方毫米5.93 TOPS/mm²的性能。
➡️

继续阅读