量子位 ·

刷新复杂Agent推理记录！阿里通义开源网络智能体超越DeepSeek R1，Grok-3

💡 原文中文，约6200字，阅读约需15分钟。

📝

内容提要

阿里巴巴通义实验室推出的WebSailor开源网络智能体，通过后训练方法显著提升复杂网页推理能力，成为首个挑战BrowseComp基准的开源模型，缩小了开源与闭源模型的能力差距。

🎯

🏷️

卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...
2026年KubeCon + CloudNativeCon欧洲联合活动深入探讨：OpenTofu日
2024年KubeCon欧洲首次亮相的OpenTofu Day，旨在为DevOps工程师和基础设施领导者提供交流平台，聚焦OpenTofu的实际应用、迁移...
《现金苹果》在网络浏览器中点击树木的用户将获得50万美元的奖励
美国居民今天下午1点（太平洋时间）可以在网络游戏“现金苹果”中寻找金苹果，收集足够可获$40，每天最多五次，五天内总奖金为$500,000。
X表示您可以阻止Grok编辑您的照片
该功能限制用户只能防止@Grok修改内容，测试显示该开关仅阻止在X上回复图像时标记xAI聊天机器人的机制。因全球反对，该功能在免费账户中被禁用，但付费用户...
修复Pingora开源框架中的请求走私漏洞
2025年12月，Cloudflare发现Pingora框架存在HTTP/1.x请求走私漏洞，编号CVE-2026-2833、CVE-2026-2835和...