人工智能周报 #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic与五角大楼

人工智能周报 #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic与五角大楼

💡 原文英文,约2200词,阅读约需8分钟。
📝

内容提要

Anthropic发布了Claude Sonnet 4.6,提升了编码能力和上下文处理,成为免费和专业用户的默认模型。谷歌推出Gemini 3.1 Pro,逻辑和知识基准显著提升。五角大楼威胁将Anthropic列为“供应链风险”,因其在军事使用条款上的争议。同时,Anthropic发现中国实验室试图提取Claude的能力。

🎯

关键要点

  • Anthropic发布了Claude Sonnet 4.6,提升了编码能力和上下文处理,成为免费和专业用户的默认模型。
  • Claude Sonnet 4.6的上下文窗口达到了100万标记,是之前的四倍,支持更长的代码库和合同处理。
  • 谷歌推出Gemini 3.1 Pro,逻辑和知识基准显著提升,ARC-AGI-2得分为77.1%。
  • 五角大楼威胁将Anthropic列为“供应链风险”,因其在军事使用条款上的争议。
  • Anthropic发现中国实验室试图提取Claude的能力,进行工业规模的“蒸馏”攻击。

延伸问答

Claude Sonnet 4.6的主要改进是什么?

Claude Sonnet 4.6提升了编码能力和上下文处理,支持100万标记的上下文窗口,是之前的四倍。

Gemini 3.1 Pro与Claude Sonnet 4.6相比有什么优势?

Gemini 3.1 Pro在逻辑和知识基准上显著提升,ARC-AGI-2得分为77.1%,高于Claude Sonnet 4.6的60.4%。

五角大楼为何威胁将Anthropic列为供应链风险?

五角大楼因与Anthropic在军事使用条款上的争议,威胁将其列为供应链风险,影响与其合作的公司。

中国实验室对Claude的攻击是什么?

中国实验室试图通过工业规模的“蒸馏”攻击提取Claude的能力,生成超过1600万次交互。

Claude Sonnet 4.6的用户反馈如何?

早期测试者约70%的人更喜欢Sonnet 4.6,认为其在指令跟随和上下文理解上表现更好。

Gemini 3.1 Pro的可用性如何?

Gemini 3.1 Pro在Gemini应用中推出,提供免费和付费用户的不同使用层级。

➡️

继续阅读