Apple Machine Learning Research ·

一个小型自回归程序合成系统，支持受控实验

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

Cadmus系统研究小型模型在真实程序完成中的潜力，包含整数虚拟机和多样化任务的数据集。该系统以低成本进行训练，适用于程序完成和推理等研究。Cadmus模型在简单整数算术任务上超越GPT-5，显示出小模型在复杂推理中的优势，避免了大模型的未知偏差。

🎯

🔎

Cadmus系统展示了小型自回归模型在程序合成中的潜力，尤其是在复杂推理任务上表现优异。与大型模型相比，小型模型能够避免引入未知的先验因素，从而提供更清晰的研究结果。这一特性使得小型模型在特定领域的应用更具可行性，尤其是在需要深入理解数据集与任务关系的研究中。

Cadmus系统的训练成本低于200美元，这为研究人员提供了一个经济高效的选择。相比之下，传统的大型语言模型通常需要更高的计算资源和存储空间。低成本的训练使得更多的研究团队能够参与到程序合成的研究中，推动了该领域的快速发展。

虽然大型语言模型如GPT-5在许多任务中表现出色，但其引入的未知先验因素可能限制了在某些研究中的应用。Cadmus模型在简单整数算术任务上超越GPT-5，显示出小型模型在特定任务中的优势。这提醒研究人员在选择模型时需考虑任务的复杂性与模型的适用性。

❓

Cadmus系统研究小型模型在真实程序完成中的潜力，支持程序完成、归纳推理和指令跟随等研究。

Cadmus模型在简单整数算术任务上超越GPT-5，准确率达到100%，而GPT-5为95%。

Cadmus系统的训练成本低于200美元。

Cadmus系统提供有效且经济的训练控制，避免了大型模型在分布外数据理解和计算存储需求上的问题。

Cadmus系统的数据集由多样化的真实程序任务组成。

小型模型在复杂推理任务中表现出优势，能够进行更深入的研究，且成本更低。

🏷️