量子位 ·

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

Claude最新版本Opus 4.8发布，显著提升了任务执行能力和诚实性，减少了错误报告的可能性。新功能动态工作流允许多个智能体并行处理任务，提高效率。整体表现超越了前版本和竞争对手Mythos。

🎯

🔎

Opus 4.8引入的动态工作流功能，允许多个智能体并行处理任务，显著提高了效率。然而，这一功能的token消耗高于普通会话，用户在使用时需注意成本问题。此外，尽管动态工作流能优化任务处理，但也可能引发对结果的信任问题，用户需谨慎评估最终输出的准确性。

Opus 4.8在诚实性方面的改进，降低了错误报告的可能性，这对于开发者来说是一个重要的进步。AI系统常常会在缺乏证据的情况下做出自信的结论，导致误导性结果。通过更好地标记不确定性，Opus 4.8能够帮助用户更清晰地理解AI的局限性，从而做出更明智的决策。

在部分能力上，Opus 4.8的表现超越了竞争对手Mythos，这表明Claude系列在技术上的持续进步。用户在选择AI工具时，可以考虑这些性能差异，尤其是在复杂任务的执行上，Opus 4.8可能提供更可靠的支持。

❓

Claude 4.8在任务执行能力和诚实性上有显著提升，尤其是在代码任务中不报告缺陷的可能性降低到1/4。

动态工作流通过生成JavaScript脚本将任务拆解为子任务，允许数十到数百个智能体并行处理，提高效率。

动态工作流的token消耗明显高于普通Claude Code会话，首次触发时需要用户确认即将运行的内容。

Claude 4.8更有可能标记工作中的不确定性，减少了草率下结论的情况，发生过度自信行为的概率下降至1/10。

用户可以通过在提示中使用「workflow」一词直接启动动态工作流，或开启Claude Code的ultracode设置让Claude自动判断何时使用。

Anthropic正在开发一款成本更低但能力接近Opus水平的模型。

🏷️