小红花·文摘

本研究分析了现有代码补全评估基准在实际开发中的不足，提出了Codev-Agent系统，通过动态调用链提取和生成新测试样本来改进评估过程，最终开发出Codev-Bench，为现代软件开发中的代码补全提供更现实的评估框架。