量子位 ·

AI代码补全哪家强？两个新指标+一套新框架，让模型更懂开发者

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

中兴通讯团队提出了新评测指标LCP和ROUGE-LCP，以及SPSR-Graph框架，旨在提升AI代码补全工具的性能，更好地满足开发者需求。这些方法解决了AI工具在代码补全中的关键痛点，增强了模型对复杂代码结构的理解能力。

🎯

🔎

中兴通讯团队提出的LCP和ROUGE-LCP指标，旨在更好地反映开发者的真实需求。这些指标强调了代码补全建议的开头部分对用户采纳的重要性，能够帮助开发者更快地判断AI建议的有效性，从而提升开发效率。

SPSR-Graph框架通过构建代码知识图谱，增强了AI对复杂代码结构的理解能力。这种方法不仅保留了代码的语法结构，还重排了语义依赖，使得模型在处理跨文件和模块的代码时表现更佳，适应复杂的工业环境。

研究表明，用户对AI代码补全建议的采纳率与LCP值呈显著正相关。这意味着，开发者更倾向于接受那些在开头部分就能准确匹配的建议，而不是追求整体的完美匹配。这一发现为未来的AI模型优化提供了重要参考。

❓

中兴通讯团队提出了LCP（最长公共前缀长度）和ROUGE-LCP两个新评测指标。

LCP强调从第一个字符开始的连续匹配性，更能反映用户在实际操作中的体验。

SPSR-Graph框架的主要目标是通过构建代码知识图谱，帮助AI理解复杂代码仓库的结构和语义。

实验结果显示，LCP值与用户采纳率之间存在显著正相关，LCP越高，用户越愿意采纳AI的建议。

ROUGE-LCP在LCP基础上进行归一化，能够公平比较不同长度的补全样本，反映模型输出的实用性。

未来团队将继续研究LCP和ROUGE-LCP指标在更多代码生成任务中的适配性，并探索与强化学习的结合。

🏷️