💡 原文中文,约3400字,阅读约需8分钟。
📝

内容提要

美团LongCat团队发布了LongCat-Flash-Thinking-2601模型,具备卓越的智能体搜索和工具调用能力,支持重思考模式,提升决策质量。该模型在编程和数学推理等评测中表现优异,已开源并可在线体验,旨在降低开发者使用门槛。

🎯

关键要点

  • 美团LongCat团队发布LongCat-Flash-Thinking-2601模型,具备智能体搜索和工具调用能力。
  • 该模型在编程和数学推理等评测中表现优异,已开源并可在线体验。
  • LongCat-Flash-Thinking-2601支持重思考模式,提升决策质量。
  • 重思考模式分为并行思考和总结归纳两个阶段,确保思考周全。
  • 模型在编程能力、数学推理、智能体工具调用等方面达到开源SOTA水平。
  • 通过环境扩展与多环境强化学习,提升模型的泛化能力。
  • 在噪声环境下进行稳健训练,提高模型的环境适应能力。
  • 美团LongCat团队开放模型权重、推理代码,降低开发者使用门槛。
➡️

继续阅读