小红花·文摘

字节跳动与南京大学联合推出的CriticLean框架，将数学自然语言转化为Lean 4代码的准确率从38%提升至84%。该框架通过强化学习和评估模型，解决了数学形式化中的语义对齐和评价可靠性问题，显著增强了自动化定理证明能力。

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

量子位 ·

本文重新审视了奥林匹克级几何中自动化定理证明的挑战，并介绍了一种代数方法，称为Wu的方法。作者发现Wu的方法在解决IMO-AG-30问题方面表现出了令人惊讶的强度，并与其他技术结合可以显著提高性能。文章指出了Wu的方法的潜力和局限性，并呼吁进一步发展。总的来说，这篇文章为重新评估Wu的方法提供了令人信服的案例，并鼓励进一步探索这种方法。

第一位超越国际数学奥林匹克金牌得主的人工智能

极道 ·