FrontierMath是一个由专家数学家设计的数学推理基准,旨在评估人工智能在高级数学方面的能力。该基准包含大量具有挑战性的数学问题,目前的AI模型在解决这些问题上仍显不足。
完成下面两步后,将自动完成登录并继续当前操作。