软件开发生命周期视角:代码大型语言模型和智能体基准的调查

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究分析了461篇论文中的181个基准,发现CodeLLMs和智能体评估在软件开发生命周期中的覆盖不均,约60%集中在开发阶段,而需求工程和设计阶段仅占5%和3%。研究还指出了当前的挑战,并提出了未来的研究方向。

🎯

关键要点

  • 本研究分析了461篇论文中的181个基准。

  • 发现CodeLLMs和智能体评估在软件开发生命周期中的覆盖不均。

  • 约60%的基准集中在开发阶段。

  • 需求工程和设计阶段的基准仅占5%和3%。

  • 研究指出了当前的挑战。

  • 提出了未来的研究方向,以缩小理论能力与实际应用之间的差距。

➡️

继续阅读