AdaCCD: 基于自适应语义对比发现的跨语言代码克隆检测领域适应
原文中文,约500字,阅读约需2分钟。发表于: 。AdaCCD 是一种新颖的跨语言适应方法,可以在新的语言中检测克隆代码,而无需任何该语言的注释。AdaCCD 利用预训练的编程语言模型中的语言无关的代码表示,并提出了自适应精炼对比学习框架,以将知识从资源丰富的语言传递到资源匮乏的语言。通过构建由 5 种编程语言组成的多语言代码克隆检测基准集,我们评估了 AdaCCD 的跨语言适应结果。与其他基线方法相比,AdaCCD...
本文介绍了一种新的代码到代码搜索技术,通过静态和动态特征以及利用相似和不同的示例来提高大型语言模型的性能。该方法能够在训练期间编码动态运行时信息,无需执行搜索语料库或搜索查询。研究验证了该方法的有效性,并展示了增强LLMs执行跨语言代码到代码搜索的能力。开源模型的重要性也得到了凸显。