本文提出了一种零空间成本的容错机制,通过可微结构修剪、权重复制和投票以及嵌入最显著位(MSBs)到模型权重中,有效减少了硬件故障对模型预测的影响,并在 GLUE 基准的九个任务上使用 BERT 模型进行实验验证了该方法的有效性。
本文提出了一种故障感知的框架 FARe,用于在存在故障情况下减轻训练图神经网络的影响,该框架在准确性和时间开销方面优于现有方法。实验结果表明,相比无故障情况下的对比系统,FARe 框架可以在故障的 ReRAM 硬件上只增加约 1% 的时间开销,将 GNN 测试准确率提高 47.6%。
完成下面两步后,将自动完成登录并继续当前操作。