💡
原文英文,约2200词,阅读约需8分钟。
📝
内容提要
Anthropic发布了Claude Sonnet 4.6,提升了编码能力和上下文处理,成为免费和专业用户的默认模型。谷歌推出Gemini 3.1 Pro,逻辑和知识基准显著提升。五角大楼威胁将Anthropic列为“供应链风险”,因其在军事使用条款上的争议。同时,Anthropic发现中国实验室试图提取Claude的能力。
🎯
关键要点
- Anthropic发布了Claude Sonnet 4.6,提升了编码能力和上下文处理,成为免费和专业用户的默认模型。
- Claude Sonnet 4.6的上下文窗口达到了100万标记,是之前的四倍,支持更长的代码库和合同处理。
- 谷歌推出Gemini 3.1 Pro,逻辑和知识基准显著提升,ARC-AGI-2得分为77.1%。
- 五角大楼威胁将Anthropic列为“供应链风险”,因其在军事使用条款上的争议。
- Anthropic发现中国实验室试图提取Claude的能力,进行工业规模的“蒸馏”攻击。
❓
延伸问答
Claude Sonnet 4.6的主要改进是什么?
Claude Sonnet 4.6提升了编码能力和上下文处理,支持100万标记的上下文窗口,是之前的四倍。
Gemini 3.1 Pro与Claude Sonnet 4.6相比有什么优势?
Gemini 3.1 Pro在逻辑和知识基准上显著提升,ARC-AGI-2得分为77.1%,高于Claude Sonnet 4.6的60.4%。
五角大楼为何威胁将Anthropic列为供应链风险?
五角大楼因与Anthropic在军事使用条款上的争议,威胁将其列为供应链风险,影响与其合作的公司。
中国实验室对Claude的攻击是什么?
中国实验室试图通过工业规模的“蒸馏”攻击提取Claude的能力,生成超过1600万次交互。
Claude Sonnet 4.6的用户反馈如何?
早期测试者约70%的人更喜欢Sonnet 4.6,认为其在指令跟随和上下文理解上表现更好。
Gemini 3.1 Pro的可用性如何?
Gemini 3.1 Pro在Gemini应用中推出,提供免费和付费用户的不同使用层级。
➡️