The Verge ·

Anthropic因Claude Fable隐形保护措施而道歉

💡 原文英文，约900词，阅读约需3分钟。

📝

内容提要

Anthropic公司为其AI模型Claude Fable隐秘限制用户而道歉，承诺提高透明度，明确安全措施触发的时机。高风险查询将被重定向至旧版模型Claude Opus 4.8，承认之前的隐形保护措施不当，将改善用户体验。

🎯

🔎

Anthropic公司承诺提高透明度，明确安全措施的触发时机。这一变化不仅有助于用户理解模型的限制，也能增强用户对AI系统的信任。透明的安全措施可以减少误解和不满，尤其是在高风险查询的处理上。

对于高风险查询，Claude Fable将重定向至旧版模型Claude Opus 4.8。这一策略虽然能保护系统安全，但也可能影响用户体验，尤其是在生物学等领域，用户可能会发现模型的可用性受到限制。

Anthropic承认之前的隐形保护措施不当，导致用户在触发安全措施时未被通知。这种做法可能会影响研究人员和开发者的工作，限制了对新模型的评估和使用，反映出在AI开发中平衡安全与可用性的重要性。

❓

Anthropic为其AI模型Claude Fable隐秘限制用户而道歉，承认之前的隐形保护措施不当。

隐形保护措施导致用户在触发安全限制时未被通知，影响了用户体验。

Anthropic承诺提高透明度，明确安全措施触发的时机，并在高风险查询时重定向至旧版模型Claude Opus 4.8。

高风险查询将被重定向至Claude Opus 4.8，用户会被通知触发了安全措施。

Anthropic承诺将公开说明如何处理高风险查询，并确保用户在触发安全措施时得到通知。

Claude Fable的系统卡是公开文档，解释如何处理高风险查询和模型的工作原理。

🏷️