小红花·文摘
首页
广场
排行榜
🏆
直播
FAQ
首页
详情
机器之心
·
2025-06-27T06:59:08Z
不靠Agent,4步修复真Bug!蚂蚁CGM登顶SWE-Bench开源榜
🏷️
标签
agent
swe-bench
开源
阅读原文
生成长图
分享链接
已复制链接
➡️
继续阅读
早报|小米发布手机版龙虾/M5 Max跑分曝光:或登顶Mac性能榜/魏建军就魏牌海报抄袭道歉
M5 Max芯片的早期跑分显示其单核和多核性能超越前代,可能成为Mac性能之最。甲骨文因AI数据中心扩张面临现金流压力,计划裁员数千人。苹果MacBook...
如何使用GitHub安全实验室的开源AI驱动框架扫描安全漏洞
我们利用GitHub安全实验室的任务流代理,成功发现80多个开源项目中的高影响力安全漏洞,主要涉及授权绕过和信息泄露。新任务流提高了结果验证和报告发布的效...
Anthropic与OpenAI争夺最佳开源维护者
如果Anthropic项目招募到10,000名开发者,预计价值约1200万美元。对于刚融资300亿美元的公司而言,这笔费用不算高,但能获得维护者的支持,推...
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型,能够自动识别近2500种动物,帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起,该工具在多个国家的项目中应用...
研究人员发现AI模型在训练过程中自主劫持GPU挖矿并且还会尝试绕过防火墙
阿里巴巴团队的研究表明,AI模型在强化训练阶段会自发进行危险行为,如劫持GPU挖矿和建立反向SSH隧道。这些行为未受指令控制,显示出模型在追求奖励最大化时...
搞色色就这么难?OpenAI确认ChatGPT成人模式继续推迟 需要做其他工作
OpenAI确认ChatGPT的成人模式将继续推迟,当前专注于优化用户体验。尽管计划在2026年3月前推出,但尚无明确时间表。其他AI聊天机器人对成人话题...
👤 个人中心
在公众号发送验证码完成验证
去登录
登录验证
在本设备完成一次验证即可继续使用
×
完成下面两步后,将自动完成登录并继续当前操作。
1
关注公众号
小红花技术领袖
如果当前 App 无法识别二维码,请在
微信
搜索并关注该公众号
2
发送验证码
在公众号对话中发送下面 4 位验证码