量子位 ·

Fable 5自带反蒸馏机制！检测到就降智，误触率高到离谱

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

Anthropic发布的新模型Fable 5引发用户不满，因其安全检测机制频繁切换至旧模型Opus 4.8，影响使用体验。尽管Fable 5能力强大，但在高风险场景下自动降低回答质量，用户对此感到困惑。模型厂商应告知用户能力变化，以免影响学术研究和技术交流。

🎯

🔎

Fable 5的安全护栏机制频繁触发，用户在进行普通任务时也可能被切换回旧模型Opus 4.8。这种误触现象远高于官方宣称的5%，导致用户体验大幅下降，尤其是在网络安全等高风险场景中，用户需特别注意这一点。

Fable 5在怀疑用户意图时，会自动降低回答质量，而不通知用户。这种隐性降级可能对学术研究和技术交流造成负面影响，用户在使用时应警惕模型能力的变化，尤其是在涉及前沿技术的讨论中。

Fable 5的token消耗成本显著高于Opus 4.8，且采用限量开放策略，用户对未来的收费模式产生疑虑。随着使用限制和成本的增加，用户需关注模型的实际使用价值与经济性。

❓

Fable 5的安全检测机制会在检测到高风险场景时自动切换到旧模型Opus 4.8，并且在怀疑用户想用其输出训练模型时，会降低回答质量。

用户普遍反映Fable 5的安全护栏触发频率远高于官方宣称的5%，导致使用体验不佳，尤其是在网络安全和生物医学领域。

在网络安全任务上，Fable 5的实际表现与Opus 4.8相当，用户体验并未得到提升。

Anthropic选择限量开放Fable 5，可能是为了在IPO前向投资者展示其掌握的前沿模型能力，同时控制使用成本。

Fable 5的token消耗成本明显高于Opus 4.8，接近后者的两倍，这引发了用户对未来收费模式的质疑。

研究人员担心Fable 5在识别到前沿LLM研发相关内容时主动降低回答质量，这可能对学术研究和技术交流产生负面影响。

🏷️