OpenAI推出FrontierScience基准测试,评估AI在科学推理和研究中的能力。GPT-5.2表现优异,但在复杂科研任务上仍有不足。该测试强调原创性和专家参与,为AI改进提供新参考。
完成下面两步后,将自动完成登录并继续当前操作。