FM Agent登顶OpenAI MLE-Bench,由百度智能云研发
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得了领先成绩,超越了微软和OpenAI的系统,展现了其强大的AI能力和自主优化能力。
🎯
关键要点
- 百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得领先成绩。
- FM Agent超越了微软的R&D Agent和OpenAI的AIDE系统。
- MLE-Bench是评估AI Agent实战能力的核心榜单,包含75个真实Kaggle竞赛项目。
- FM Agent在中等和高难度任务上的表现显著领先,展现强大的攻坚能力。
- FM Agent具备自主优化能力,能够系统性分析问题并优化解决方案。
- 百度近期在AI领域频繁动作,开源的文心4.5衍生模型在OmniDocBench中表现优异。
- 百度年度科技大会“百度世界2025”定于11月13日举行。
➡️