BriefGPT - AI 论文速递 ·

aiXcoder-7B：一种轻量级和有效的大型语言模型用于代码补全

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本研究评估了多种大型语言模型在代码生成和理解方面的能力，提出了新模型PolyCoder和LongCoder，并展示了其在代码补全任务中的优越性能。研究还分析了模型在真实代码库中的表现，并提出了迭代指令提示技术以提高模型准确性，为自动编程奠定基础。

🎯

🔎

PolyCoder模型在C语言中的表现优于Codex等其他模型，显示出开源模型在特定编程语言上的潜力。这为开发者提供了更多选择，尤其是在需要高效代码补全的场景中，开源解决方案可能成为商业产品的有力竞争者。

研究中提出的迭代指令提示（IIP）技术显著提高了较弱模型的准确性，最高提升达18.96%。这一技术的应用可能为未来的自动编程工具提供新的思路，尤其是在处理复杂代码时，能够有效提升模型的性能。

本研究强调了在真实代码库中评估大型语言模型的重要性。通过新的基准测试DevEval，研究揭示了现有模型在实际应用中的不足，这为未来的模型改进提供了方向，开发者在选择模型时应关注其在真实环境中的表现。

❓

aiXcoder-7B模型在代码补全任务中表现优越，尤其是在C编程语言上优于其他模型，包括Codex。

LongCoder模型采用滑动窗口机制和全局可访问的标记，以提高代码补全的性能和效率。

迭代指令提示技术有效提高了较弱模型的准确性，最高提升达18.96%。

经过微调的Code Llama模型在参数数量较少的情况下，正确性提升达55.2%。

通过新的基准测试DevEval，评估了8种流行的大型语言模型在真实代码库中的编码能力。

研究为未来的自动编程和复杂任务的完成奠定了基础，展示了大型语言模型的潜力。

🏷️