OpenAI发布会没说的秘密:新指标遥遥领先,为何在关键的人类偏好测试中,它仍然输给了对手?|GPT-5.2 vs Gemini 3 Pro benchmarks comparison
GPT-5.2是OpenAI最新发布的AI模型,旨在提升开发者的生产力,具备更强的推理能力和结构化输出。尽管输出质量显著提高,但速度较慢且上下文处理存在问题。新指标GDP val用于评估模型在复杂任务中的表现,GPT-5.2得分70.9,领先于其他模型,适合专业工作者使用。
原文中文,约6900字,阅读约需17分钟。