Micropaper ·

一分钟读论文：《当 Many-Shot Prompting 失败时：LLM 代码翻译的实证研究》

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

论文《当多示例提示失败：LLM代码翻译的实证研究》揭示了“多示例悖论”：在代码翻译任务中，5-25个示例效果最佳，过多示例反而降低性能。研究基于90,000次实验，强调示例数量与性能的关系，推翻了“示例越多越好”的传统观念。

🎯

🔎

研究揭示的'多示例悖论'挑战了传统观念，表明在代码翻译任务中，5-25个示例的效果最佳。这一发现提醒开发者在设计提示时，需关注示例数量的合理性，而非盲目增加示例。

通过90,000次实验，研究提供了强有力的实证数据，确保了结论的可靠性。这种大规模的研究方法为后续的LLM优化和提示工程提供了坚实的基础，值得其他领域借鉴。

虽然研究强调了示例数量的重要性，但示例的质量同样不可忽视。开发者在选择示例时，应确保其具有代表性和多样性，以最大化LLM的性能。

❓

多示例悖论指的是在代码翻译任务中，5-25个示例效果最佳，超过25个示例反而会降低性能。

研究团队通过90,000次翻译实验，涵盖6种语言和30种语言对，采用大规模实证研究的方法。

在代码翻译中，最佳的示例数量是5-25个Few-Shot示例。

过多的示例会导致LLM在语义复杂的任务中感到困惑，从而影响性能。

建议开发者在代码翻译任务中使用5-25个Few-Shot示例，并关注示例的质量。

这项研究推翻了“示例越多越好”的传统观念，强调在某些情况下，少量示例效果更佳。

🏷️