GPT-5全面领先,OpenAI发布FrontierScience,「推理+科研」双轨检验大模型能力

HyperAI超神经 HyperAI超神经 ·

2025 年 12 月 16 日,OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience,并以「FrontierScience:evaluating AI’s ability to perform expert-level scientific tasks」为题发布论文成果。根据初步评估,GPT-5.2 在 FrontierScience-Olympiad 和...

阅读原文