ConvBench:一个用于 2D 卷积基元评估的综合基准
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了深度学习加速器性能分析框架SimDIT,可对卷积和非卷积操作进行详细统计,通过优化资源分配实现了18倍性能提升。
🎯
关键要点
- 提出了一种深度学习加速器性能分析框架SimDIT。
- SimDIT覆盖卷积和非卷积操作,提供详细的性能统计。
- 在64X64处理阵列上,ResNet-50训练工作量的非卷积操作占总运行时间的59.5%。
- 通过优化DRAM带宽和SRAM资源分配,SimDIT实现了18倍的性能提升。
➡️