InfoQ ·

Anthropic的Claude Opus 4.1提升了重构和安全性，SWE-bench Verified得分达到74.5%

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

Anthropic推出Claude Opus 4.1，提升了多文件项目的编码可靠性和长时间交互的推理能力，SWE-bench Verified得分达到74.5%。新版本改善了代码重构和推理链跟踪，安全性提升，'无害响应率'达到98.76%。该模型现已向付费用户开放。

🎯

🏷️

15.68 万元买 D 级车！丰田铂智 7 这次真想通了
2025年，合资品牌电动车迎来转折，广丰铂智3X销量突破7万辆，打破智能化刻板印象。铂智7预售价15.68万元，设计更具攻击性，搭载华为鸿蒙座舱与激光雷达...
OpenAI GPT-5.4发布，AI迎来就业报告，Anthropic在美国禁令后激增
Anthropic的新研究提出了“观察到的曝光”指标，结合理论LLM能力与实际使用数据。结果显示，AI尚未达到理论能力，实际任务覆盖率远低于可行范围。程序...
AI 时代的人类处境：科技、宗教与生命意义的重构
在AI时代，科技与宗教的关系需重新审视。科技改变人与世界的互动，但无法消解人类对意义和死亡的思考。宗教应超越消费，关注真实修行。科学与宗教的关系可视为对立...
Anthropic与OpenAI争夺最佳开源维护者
如果Anthropic项目招募到10,000名开发者，预计价值约1200万美元。对于刚融资300亿美元的公司而言，这笔费用不算高，但能获得维护者的支持，推...
Hardening Firefox with Anthropic’s Red Team
For more than two decades, Firefox has been one of the most scrutinized and s...
布鲁斯·莫姆贾恩：新演讲
我一直想做关于预写日志（WAL）的演讲，随着Postgres对WAL功能的依赖增加，演讲内容逐渐丰富，最终形成了103张幻灯片。