Last Week in AI ·

人工智能周报 #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic与五角大楼

💡 原文英文，约2200词，阅读约需8分钟。

📝

内容提要

Anthropic发布了Claude Sonnet 4.6，提升了编码能力和上下文处理，成为免费和专业用户的默认模型。谷歌推出Gemini 3.1 Pro，逻辑和知识基准显著提升。五角大楼威胁将Anthropic列为“供应链风险”，因其在军事使用条款上的争议。同时，Anthropic发现中国实验室试图提取Claude的能力。

🎯

关键要点

Anthropic发布了Claude Sonnet 4.6，提升了编码能力和上下文处理，成为免费和专业用户的默认模型。
Claude Sonnet 4.6的上下文窗口达到了100万标记，是之前的四倍，支持更长的代码库和合同处理。
谷歌推出Gemini 3.1 Pro，逻辑和知识基准显著提升，ARC-AGI-2得分为77.1%。
五角大楼威胁将Anthropic列为“供应链风险”，因其在军事使用条款上的争议。
Anthropic发现中国实验室试图提取Claude的能力，进行工业规模的“蒸馏”攻击。

🔎

延伸解读

Claude Sonnet 4.6的优势与应用

Claude Sonnet 4.6的上下文窗口扩大至100万标记，使其在处理长代码库和复杂合同时表现更佳。这一改进不仅提升了编码能力，还增强了模型在知识工作和设计方面的应用潜力，适合需要高效处理大量信息的用户。

Gemini 3.1 Pro的市场竞争力

谷歌的Gemini 3.1 Pro在逻辑和知识基准测试中表现优异，尤其是在ARC-AGI-2中得分77.1%。这一成绩不仅超越了Claude Sonnet 4.6，也显示出谷歌在AI领域的持续进步，可能会对市场格局产生深远影响。

五角大楼与Anthropic的紧张关系

五角大楼威胁将Anthropic列为“供应链风险”，反映出军事与科技公司之间在AI使用条款上的深刻分歧。这一事件可能影响Anthropic的商业合作，尤其是在与其他科技公司的竞争中，需密切关注后续谈判进展。

中国实验室的“蒸馏”攻击

Anthropic发现中国实验室试图通过“蒸馏”攻击提取Claude的能力，这一行为不仅显示出技术竞争的激烈，也提醒其他公司加强对自身技术的保护措施，以防止类似的工业规模攻击。

❓

延伸问答

Claude Sonnet 4.6的主要改进是什么？

Claude Sonnet 4.6提升了编码能力和上下文处理，支持100万标记的上下文窗口，是之前的四倍。

Gemini 3.1 Pro与Claude Sonnet 4.6相比有什么优势？

Gemini 3.1 Pro在逻辑和知识基准上显著提升，ARC-AGI-2得分为77.1%，高于Claude Sonnet 4.6的60.4%。

五角大楼为何威胁将Anthropic列为供应链风险？

五角大楼因与Anthropic在军事使用条款上的争议，威胁将其列为供应链风险，影响与其合作的公司。

中国实验室对Claude的攻击是什么？

中国实验室试图通过工业规模的“蒸馏”攻击提取Claude的能力，生成超过1600万次交互。

Claude Sonnet 4.6的用户反馈如何？

早期测试者约70%的人更喜欢Sonnet 4.6，认为其在指令跟随和上下文理解上表现更好。

Gemini 3.1 Pro的可用性如何？

Gemini 3.1 Pro在Gemini应用中推出，提供免费和付费用户的不同使用层级。

🏷️