How Robust Are Large Language Models in Understanding Code Against Semantics-Preserving Mutations?

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了大语言模型在编程任务中理解代码的鲁棒性。通过五种保持语义的代码变异,评估了多个先进模型对Python程序的理解能力。结果显示,部分模型在61%的情况下基于错误推理做出正确预测,表明其对代码变异的鲁棒性有限,这对大语言模型在编程领域的应用提出了挑战。

🎯

关键要点

  • 本研究探讨了大语言模型在编程任务中理解代码的鲁棒性。
  • 研究采用了五种保持语义的代码变异来评估多个先进模型对Python程序的理解能力。
  • 结果显示,部分模型在61%的情况下基于错误推理做出正确预测。
  • 这表明大语言模型对代码变异的鲁棒性有限。
  • 这一发现对大语言模型在编程领域的有效应用提出了挑战。
➡️

继续阅读