小红花·文摘 - 小红花技术领袖俱乐部

字节推出的Seed-Prover模型在数学推理方面表现优异，解决了78.1%的国际数学奥林匹克（IMO）难题，并在普特南数学竞赛中取得显著成绩。该模型结合引理式证明和Seed-Geometry引擎，建立了独特的几何问题库，达到了IMO银牌水平。

字节Seed数学新模型，SOTA了

量子位 ·

本文探讨了科学理论选择中的关键问题，特别是普特南的批判性与解释性倾向。作者提出了一种新的理解框架，认为这两种倾向相辅相成，机器学习模型能够为科学辩论提供新启示，促进理论选择的理解。

Interpreting Putnam's Critical and Explanatory Tendencies from a Machine Learning Perspective

BriefGPT - AI 论文速递 ·

o1 Pro在普特南数学竞赛中以36分钟完成12道题，速度惊人。尽管考试难度极高，平均分接近0，只有少数人能满分，Pro的表现虽快，但仍有漏答，质量有待提升。

o1 Pro挑战最难本科数学考试，36分钟16秒交卷

量子位 ·