小红花·文摘

本研究提出了ProjectEval基准，旨在解决现有编程智能体在代码生成能力评估方面的不足，特别是从用户角度进行的自动评估和结果可解释性。研究表明，系统化的工程项目代码及对项目的整体理解是实现实际项目的关键，为开发更有效的编程智能体提供了重要见解。