The Code Duplication Dilemma: Unveiling the Repetition Phenomenon in Code Generation Based on Large Language Models 本研究关注大型语言模型生成代码中的重复问题,探讨了19种先进代码LLM中重复现象的普遍性和特征,并总结出20种重复模式。通过提出DeRep方法,研究实现了对代码中重复现象的有效检测和缓解,实验结果显示DeRep在减少重复和提升代码质量方面相较于基准方法有显著改善。 本研究分析了19种先进代码大型语言模型中的重复现象,提出了20种重复模式,并通过DeRep方法有效检测和缓解这些重复。实验结果表明,该方法在减少重复和提升代码质量方面优于基准方法。 DeRep方法 models 代码生成 代码质量 大型语言模型 重复问题