基于 ReRAM 的 Transformer 语言模型的零空间成本容错技术
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种零空间成本的容错机制,通过可微结构修剪、权重复制和投票以及嵌入最显著位(MSBs)到模型权重中,有效减少了硬件故障对模型预测的影响,并在 GLUE 基准的九个任务上使用 BERT 模型进行实验验证了该方法的有效性。
🎯
关键要点
- 提出了一种零空间成本的容错机制
- 采用可微结构修剪、权重复制和投票
- 将最显著位(MSBs)嵌入到模型权重中
- 有效减少了硬件故障对模型预测的影响
- 在 GLUE 基准的九个任务上进行实验验证
- 使用 BERT 模型进行实验
➡️