通过强化学习提升汇编代码性能的大型语言模型

📝

内容提要

本研究旨在探讨大型语言模型(LLMs)在优化汇编代码性能方面的潜力,填补了代码优化研究的空白。我们提出了一种基于强化学习的框架,利用近端策略优化(PPO)来训练LLMs,并结合功能正确性和执行性能的奖励函数。研究表明,我们的模型在测试通过率和执行速度上均优于行业标准编译器gcc -O3,表明强化学习可以有效提升汇编代码的性能优化能力。

🏷️

标签

➡️

继续阅读