小红花·文摘

本研究探讨了大型语言模型（LLMs）在不依赖硬件的情况下预测并行GPU代码性能的能力。结果表明，经过调优的LLMs在零-shot和few-shot条件下表现优异，能够有效区分计算密集型和带宽密集型的GPU内核，为性能分析和优化提供了新思路。