评估大型语言模型对代码可维护性的能力

原文约300字,阅读约需1分钟。发表于:

通过控制代码的逻辑行数 (LLOC),LLMs 计算出的交叉熵是一种可预测可维护性的指标,但是在类级别上,仅仅以此准则可能不足以预测维护性,需要进一步研究以充分利用此信息。

研究使用新的代码修改表示格式和大型语言模型,提高了自动修复代码漏洞的准确性和适应性。研究还评估了当前的评估指标,并强调了数据集完整性和训练样本缺失测试数据集的重要性。这项工作对提高代码安全和推动相关领域的研究具有潜力。

相关推荐 去reddit讨论