InfoQ ·

微软Phi-4：专为复杂数学推理而设计的小型语言模型

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

Phi-4是微软研究院开发的14B参数模型，旨在提升数学推理能力。该模型在Hugging Face上发布，采用合成数据和精选的有机数据进行训练，显著超越前代模型。经过后期优化，Phi-4在多个基准测试中表现优于Llama-3.1-405B和GPT-4o，成为可靠的AI助手。

🎯

🔎

Phi-4模型的成功在于其创新的训练方法，特别是合成数据的使用。这种方法不仅提供了更渐进的学习路径，还能更好地对齐推理上下文。这意味着，Phi-4在处理复杂数学问题时，能够更有效地理解和生成解决方案，超越了传统模型的局限性。

微软在训练Phi-4时，强调了高质量数据的关键性。通过精心筛选的有机数据和合成数据的结合，确保了模型的准确性和可靠性。数据中的微小错误可能导致合成文档质量的严重下降，因此在数据收集和处理上投入了大量精力。

Phi-4的后期训练阶段旨在将预训练模型转变为一个可靠的AI助手。通过多领域的数据微调和偏好优化，微软确保模型能够更好地满足用户需求，减少不期望的行为。这一过程对于提升用户体验至关重要，尤其是在STEM领域的应用中。

❓

Phi-4是微软研究院开发的14B参数模型，专注于提升数学推理能力，采用合成数据和精选的有机数据进行训练。

Phi-4在数学推理方面显著超越了同类和更大模型，尤其在STEM领域的问答能力上表现优异。

Phi-4的训练结合了合成数据和经过筛选的有机数据，并在后期进行了多领域的数据微调。

合成数据提供了更渐进的学习路径和更好的推理上下文对齐，帮助模型更有效地学习。

后期训练阶段包括使用高质量数据进行微调，并通过新技术Pivotal Token Search优化模型与人类偏好的对齐。

Phi-4在多个基准测试中表现优于Llama-3.1-405B和GPT-4o，尤其是在研究生级STEM问答和数学竞赛基准上。

🏷️