Structure-Aware Corpus Construction and User-Perception-Aligned Metrics for Large Language Model Code Completion

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了两种新评估指标LCP和ROUGE-LCP,以缩小代码补全评估与用户感知之间的差距。同时,提出了一种基于结构和语义重排的代码图数据处理方法,显著提高了用户感知一致性和模型性能。

🎯

关键要点

  • 本研究提出了两种新评估指标LCP和ROUGE-LCP,以缩小代码补全评估与用户感知之间的差距。
  • 新评估指标是在概率建模的视角下进行设计的。
  • 提出了一种基于保持结构和语义重排的代码图(SPSR-Graph)的数据处理方法。
  • 该方法旨在解决大型语言模型在代码补全任务中缺乏有效结构语义建模与跨模块依赖信息的问题。
  • 研究表明,这些新措施显著提高了用户感知的一致性和模型性能。
➡️

继续阅读