FM Agent登顶OpenAI MLE-Bench,由百度智能云研发

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得了领先成绩,超越了微软和OpenAI的系统,展现了其强大的AI能力和自主优化能力。

🎯

关键要点

  • 百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得领先成绩。
  • FM Agent超越了微软的R&D Agent和OpenAI的AIDE系统。
  • MLE-Bench是评估AI Agent实战能力的核心榜单,包含75个真实Kaggle竞赛项目。
  • FM Agent在中等和高难度任务上的表现显著领先,展现强大的攻坚能力。
  • FM Agent具备自主优化能力,能够系统性分析问题并优化解决方案。
  • 百度近期在AI领域频繁动作,开源的文心4.5衍生模型在OmniDocBench中表现优异。
  • 百度年度科技大会“百度世界2025”定于11月13日举行。
➡️

继续阅读