本研究探讨了大型语言模型(LLMs)在不依赖硬件的情况下预测并行GPU代码性能的能力。结果表明,经过调优的LLMs在零-shot和few-shot条件下表现优异,能够有效区分计算密集型和带宽密集型的GPU内核,为性能分析和优化提供了新思路。
完成下面两步后,将自动完成登录并继续当前操作。