论文《当多示例提示失败:LLM代码翻译的实证研究》揭示了“多示例悖论”:在代码翻译任务中,5-25个示例效果最佳,过多示例反而降低性能。研究基于90,000次实验,强调示例数量与性能的关系,推翻了“示例越多越好”的传统观念。
本研究提出RepoTransBench,以解决现有代码翻译基准无法满足真实编码需求的问题。研究表明,最佳语言模型的成功率仅为7.33%,经过迭代调试后提高至21%,显示自动代码库翻译的可靠性仍需提升。
本研究探讨了如何利用大型语言模型提升科学计算中的代码开发和翻译效率。通过开发CodeScribe工具,结合提示工程和用户监督,实现了高效的代码转换,尤其是将Fortran代码转换为C++,显著提高了科研计算的生产力。研究表明,自动化代码翻译在软件开发中具有重要潜力。
完成下面两步后,将自动完成登录并继续当前操作。