量子位 ·

FM Agent登顶OpenAI MLE-Bench，由百度智能云研发

💡 原文中文，约600字，阅读约需2分钟。

📝

内容提要

百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得了领先成绩，超越了微软和OpenAI的系统，展现了其强大的AI能力和自主优化能力。

🎯

关键要点

百度智能云的FM Agent在OpenAI MLE-Bench基准测试中取得领先成绩。
FM Agent超越了微软的R&D Agent和OpenAI的AIDE系统。
MLE-Bench是评估AI Agent实战能力的核心榜单，包含75个真实Kaggle竞赛项目。
FM Agent在中等和高难度任务上的表现显著领先，展现强大的攻坚能力。
FM Agent具备自主优化能力，能够系统性分析问题并优化解决方案。
百度近期在AI领域频繁动作，开源的文心4.5衍生模型在OmniDocBench中表现优异。
百度年度科技大会“百度世界2025”定于11月13日举行。

🏷️

标签

AI能力 FM Agent OpenAI agent 基准测试自主优化

➡️

继续阅读

中之杰智能发布德沃克X-Agent工业智能体“三剑客”产品矩阵
(全球TMT 2026年07月30日讯)浙江中之杰智能系统有限公司正式发布德沃克X-Agent工业智能体“三剑 […]
OpenAI开始测试「使用ChatGPT登录」开发者需申请接口和应用让用户可以快捷登录
#人工智能 OpenAI 开始测试「使用 ChatGPT 登录」，受邀开发者申请接口和应用后就可以让用户不需要单独注册、直接使用 ChatGPT 登录网站...
这这这…翁荔光速回OpenAI上班了
6位联合创始人——只剩2名。
OpenAI president says it’s ‘building a family of devices’ for its AI chatbots
In an interview with our friend Joanna Stern on her YouTube channel, OpenAI p...
How ChatGPT Optimizes its Agent Loop: Harness, API, and Inference
To understand what techniques are adopted in frontier labs to make AI applica...
Kernel of truth: GPT-5.6 Sol can cut its own costs, says OpenAI
OpenAI has detailed, in a new engineering blog post, how the GPT-5.6 model fa...