基于 ReRAM 的 Transformer 语言模型的零空间成本容错技术

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种零空间成本的容错机制,通过可微结构修剪、权重复制和投票以及嵌入最显著位(MSBs)到模型权重中,有效减少了硬件故障对模型预测的影响,并在 GLUE 基准的九个任务上使用 BERT 模型进行实验验证了该方法的有效性。

🎯

关键要点

  • 提出了一种零空间成本的容错机制
  • 采用可微结构修剪、权重复制和投票
  • 将最显著位(MSBs)嵌入到模型权重中
  • 有效减少了硬件故障对模型预测的影响
  • 在 GLUE 基准的九个任务上进行实验验证
  • 使用 BERT 模型进行实验
➡️

继续阅读