量子位 ·

龙虾最佳适配模型，OpenClaw之父给出了推荐

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

PinchBench榜单显示，中国模型在成功率和速度上表现优异，特别是MiniMax M2.5超越其他模型。尽管价格较高，该榜单为模型选择提供了明确参考。PinchBench由Kilo AI团队开发，专注于真实任务的评测。

🎯

🔎

根据PinchBench榜单，中国模型在成功率和速度上表现优异，尤其是MiniMax M2.5在速度上领先。然而，价格方面却相对较高，MiniMax M2.1的价格几乎是GPT-5-nano的三倍。这意味着在选择模型时，用户需要在性能和成本之间做出权衡。

PinchBench采用自动化检查与LLM评审相结合的方式，专注于真实任务的执行能力。这种评测机制强调模型在实际工作流中的表现，而不仅仅是回答问题的能力。这一特点使得PinchBench在模型评估中更具实用性，值得用户关注。

在选择适合OpenClaw的模型时，用户应关注PinchBench提供的成功率、速度和价格三大维度。榜单中推荐的模型可以作为参考，尤其是国产模型在某些方面表现突出，适合对速度有高要求的应用场景。

❓

PinchBench榜单主要评测维度为成功率、速度和价格。

MiniMax M2.5在速度上领先，完成任务速度提升37%，端到端运行时间缩短至22.8分钟。

中国模型在成功率和速度上表现优异，特别是MiniMax M2.5超越其他模型。

PinchBench由Kilo AI团队开发，该团队由GitLab前联合创始人Sid Sijbrandij投资并参与创立。

PinchBench的评测机制更侧重于真实工作流中的执行能力，而不仅仅是回答问题。

是的，PinchBench目前是完全开源的，用户可以自行运行或添加新任务。

🏷️