Apple Machine Learning Research ·

分而治之？你应该提炼你的大型语言模型的哪一部分？

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

研究表明，将推理任务分为问题分解和解决两个阶段能提高大型语言模型（LLMs）的效果。问题分解易于小模型提炼，而解决阶段需要大量领域知识。分解阶段有效推广，但解决能力提炼难度大，导致性能下降。结合小型分解模型与LLMs可实现高效推理。

🎯

🔎

将推理任务分为问题分解和解决两个阶段，可以有效提升大型语言模型的表现。问题分解阶段相对简单，适合小型模型提炼，而解决阶段则需要丰富的领域知识，这使得提炼难度增加。理解这一过程有助于优化模型的应用场景，尤其是在需要快速响应的任务中。

小型分解模型在推理任务中展现出良好的推广能力，能够在多种任务和数据集上保持较高的性能。这意味着在资源有限的情况下，使用小型模型进行问题分解可以降低推理成本，同时提高效率，适合在实际应用中进行快速迭代和调整。

尽管问题分解阶段易于提炼，但解决能力的提炼却面临性能下降的风险。这提示研究者在设计模型时，需要权衡提炼的复杂性与最终性能之间的关系，特别是在需要高准确度的应用场景中，可能需要更多的领域知识支持。

❓

推理任务可以分为问题分解阶段和解决阶段，前者关注于将问题拆解，后者则专注于解决这些问题。

问题分解阶段只需要学习一般的问题解决策略，而解决阶段需要大量的领域知识，因此更难提炼。

结合小型分解模型与大型语言模型可以实现高效推理，降低推理成本，并提高局部适应能力。

提出的方法能够在推理结果和推理成本上进行评估，以优化推理过程。

提炼解决能力的难点在于容易导致性能下降，且提炼后的模型在泛化能力上存在困难。

通过结合小型分解模型与大型语言模型，可以实现高效推理和成本效益的优化。

🏷️