小红花·文摘

中杯o3在ARC-AGI测试中得分57%，成本仅1.5美元/任务，成为OpenAI模型的性价比之王。尽管成绩较之前的o3模型有所下降，但在推理能力和成本优化方面表现优于94%的专业病毒学家。ARC-AGI测试旨在评估AI智力，o3首次挑战即取得佳绩。