小红花·文摘 - 小红花技术领袖俱乐部

DeepSeek发布了用于形式数学证明的Prover-V2开源大语言模型

DeepSeek发布了用于形式数学证明的Prover-V2开源大语言模型

InfoQ ·

本研究提出了一种“层次注意力”正则化方法，以提升大语言模型在形式定理证明中的表现。实验结果显示，该方法在miniF2F和ProofNet上的证明成功率分别提高了2.05%和1.69%，并降低了证明复杂性。

层次注意力生成更好的证明

BriefGPT - AI 论文速递 ·

本研究提出Kimina-Prover Preview，旨在提高传统形式定理证明的效率。该模型模仿人类解题策略，在miniF2F基准测试中表现达到80.7%，展现出良好的样本效率和可扩展性，具有在形式验证与非正式数学直觉之间架起桥梁的潜力。

Kimina-Prover Preview: Reinforcement Learning for Large Formal Reasoning Models

BriefGPT - AI 论文速递 ·