The JetBrains Blog ·

Mellum：我们如何训练一个模型以在代码补全中表现出色

💡 原文英文，约2400词，阅读约需9分钟。

📝

内容提要

JetBrains推出了名为Mellum的AI模型，以增强代码补全功能。该模型经过三阶段训练，使用透明数据，专注于编程语言的语法和模式。Mellum通过预训练、微调和强化学习优化用户体验，表现优异。未来计划包括开发更多专业模型和扩展参数。

🎯

🔎

Mellum模型的训练分为预训练、微调和强化学习三个阶段。预训练阶段使用大量代码数据，帮助模型学习编程语言的基本语法和模式。微调阶段则通过提取更具上下文意义的代码片段，提升模型的理解能力。最后，强化学习阶段确保模型生成的建议更符合用户期望，减少不必要的生成行为。

在训练Mellum时，JetBrains特别强调使用透明数据，以避免潜在的版权风险。通过使用合法合规的数据源，Mellum不仅能提高模型的稳定性，还能确保用户在使用过程中不会面临法律问题。这一做法为其他AI模型的开发提供了重要的借鉴。

Mellum在训练过程中针对特定编程语言进行了微调，以捕捉语言特有的模式和开发者的工作流程。这种专门化的训练使得模型在处理常用语言（如Python和Java）时，能够提供更高质量的代码补全建议，提升了用户的编程效率。

❓

Mellum模型主要用于增强代码补全功能，提供高质量的代码建议。

Mellum模型经过预训练、微调和强化学习三个阶段进行训练，以提高代码补全的质量和用户体验。

Mellum模型主要使用TheStack作为数据源，并确保数据合法合规。

Mellum模型在内部和公共基准测试中表现优异，用户反馈良好。

未来计划包括开发更多专业模型和扩展参数，以支持更多AI代码任务。

通过强化学习优化模型，使其更符合用户期望，减少不必要的生成行为，从而提升用户体验。

🏷️