The Code Duplication Dilemma: Unveiling the Repetition Phenomenon in Code Generation Based on Large Language Models

本研究关注大型语言模型生成代码中的重复问题,探讨了19种先进代码LLM中重复现象的普遍性和特征,并总结出20种重复模式。通过提出DeRep方法,研究实现了对代码中重复现象的有效检测和缓解,实验结果显示DeRep在减少重复和提升代码质量方面相较于基准方法有显著改善。

本研究分析了19种先进代码大型语言模型中的重复现象,提出了20种重复模式,并通过DeRep方法有效检测和缓解这些重复。实验结果表明,该方法在减少重复和提升代码质量方面优于基准方法。

原文英文,约100词,阅读约需1分钟。发表于:
阅读原文