量子位 ·

大模型“拼好题”，45K数据撬动18%提升，数学问题拒绝死记硬背 | MathFusion

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

MathFusion通过顺序、并行和条件三种融合策略提升大语言模型在数学问题上的能力，利用45K合成指令使准确率提高18%。该方法有效捕捉问题间深层联系，展现出优越的数据效率和性能，适用于更复杂的数学问题。

🎯

🔎

MathFusion采用的顺序、并列和条件融合策略，能够有效捕捉数学问题之间的内在联系。这种方法不仅提升了模型的准确率，还增强了其解决复杂问题的能力，尤其适合处理多步骤和依赖关系的问题。

MathFusion在仅使用45K合成指令的情况下，取得了18%的准确率提升，显示出其在数据效率上的优势。这意味着在数据量有限的情况下，仍能实现显著的性能提升，适合资源受限的应用场景。

尽管MathFusion在简单数学问题上表现优异，但其验证仍局限于GSM8K和MATH等基础数据集。未来需要将其扩展到更复杂的数学问题和其他领域，以验证其广泛适用性和有效性。

❓

MathFusion通过顺序、并行和条件三种融合策略，将不同的数学问题结合，生成新的问题，从而提升模型的能力。

MathFusion仅使用了45K合成指令。

MathFusion在多个基准测试中平均准确率提升了18%。

顺序融合将两个问题串联，前一个问题的答案作为后一个问题的输入条件；而并列融合则将两个相似的问题融合，提出新的问题。

实验结果显示，MathFusion显著提升了模型性能与效率，并保持高数据效率。

MathFusion的“问题融合”思路与DART-Math的“挖掘难题”思路是互补的，结合使用可进一步提升性能。

🏷️