基于强化学习的适应性不更正场地 DRAM 错误抵制
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种自适应方法来触发未纠正错误的缓解,通过预测方法考虑了未纠正错误的可能性和当前潜在成本。在 MareNostrum 超级计算机的生产日志中,该方法将失去的计算时间减少了 54%,仅低于最优 Oracle 方法的 6%。
🎯
关键要点
- 提出了一种自适应方法来触发未纠正错误的缓解。
- 该方法基于预测,考虑未纠正错误的可能性和当前潜在成本。
- 使用经典机器学习度量及成本效益分析评估该方法。
- 在 MareNostrum 超级计算机的两年生产日志中,失去的计算时间减少了 54%。
- 该方法的效果仅低于最优 Oracle 方法的 6%。
- 所有源代码均为开源。
🏷️
标签
➡️