Llemma:帮你攻克奥数难题的数学语言模型

原文约800字,阅读约需2分钟。发表于:

这是一款名为 Llemma 的开源语言模型,该模型是为数学设计的。 Llemma 模型是在自定义数据集上进行训练的,数据集由从网络上各种来源抓取的数学论文和文本组成。 在数学语料库上持续预训练后,开放语言模型提高了形式定理证明任务的小样本性能。  特点: Llemma能正确解决高中或奥林匹克级别数学问题。 与 COPRA 和 Proverbot9001 等其他模型相比,它在 Lean 和 Coq

Llemma是一款为数学设计的开源语言模型,使用自定义数据集进行训练,能够解决高中或奥林匹克级别数学问题,并在Lean和Coq等系统中解决数学证明的能力。Llemma在MATH基准上的性能优于所有已知的开放基础模型,无需任何进一步的微调。

相关推荐 去reddit讨论