层次上下文剪枝:通过仓库级预训练代码语言模型优化实际代码补全
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
DraCo是一种用于仓库级别代码自动补全的数据流引导检索增强方法。通过数据流分析和建立代码实体之间的关系,形成仓库特定的上下文图。实验证明DraCo在精确匹配代码和标识符方面的准确性和适用性较先进方法平均提高了3.43%和3.27%。
🎯
关键要点
-
DraCo是一种用于仓库级别代码自动补全的方法。
-
DraCo通过数据流分析解析私有仓库中的代码实体并建立关系。
-
DraCo形成了一个仓库特定的上下文图,以支持代码自动补全。
-
DraCo在触发代码自动补全时能精确检索相关背景知识。
-
构建了一个大型Python数据集ReccEval,包含多种补全目标。
-
实验结果显示DraCo在精确匹配代码方面提升了3.43%。
-
在标识符F1分数方面,DraCo平均提升了3.27%。
➡️