我们对10个First Proof问题进行了内部测试,以评估AI系统的证明能力。专家反馈显示模型在多个问题上表现良好。我们正在训练新模型以提升推理严谨性,并与ChatGPT进行验证。期待未来与社区深入交流,评估研究级推理能力。
完成下面两步后,将自动完成登录并继续当前操作。