中杯o3在ARC-AGI测试中得分57%,成本仅1.5美元/任务,成为OpenAI模型的性价比之王。尽管成绩较之前的o3模型有所下降,但在推理能力和成本优化方面表现优于94%的专业病毒学家。ARC-AGI测试旨在评估AI智力,o3首次挑战即取得佳绩。
完成下面两步后,将自动完成登录并继续当前操作。