本研究分析了现有代码补全评估基准在实际开发中的不足,提出了Codev-Agent系统,通过动态调用链提取和生成新测试样本来改进评估过程,最终开发出Codev-Bench,为现代软件开发中的代码补全提供更现实的评估框架。
完成下面两步后,将自动完成登录并继续当前操作。