How Accurately Do Large Language Models Understand Code?
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨大型语言模型(LLM)在代码理解方面的能力,发现其在调试真实程序时,81%的故障程序调试能力下降,表明LLM对代码的理解较为肤浅,主要依赖与语义无关的特征。
🎯
关键要点
- 本研究探讨大型语言模型(LLM)在代码理解方面的能力。
- 研究填补了评估LLM理解代码缺乏标准化指标的空白。
- 通过变异测试的方法,发现LLM在调试真实程序时,81%的故障程序调试能力下降。
- 结果表明LLM对代码的理解较为肤浅,主要依赖与语义无关的特征。
➡️