蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

蚂蚁百灵于5月15日开源思考模型Ring-2.6-1T,该模型支持可调推理强度,适用于多种任务,特别是在高频工作流和高难任务中表现优异。它采用异步强化学习架构,解决了训练不稳定的问题。百灵强调模型在真实生产环境中的应用,近期发布的Ling-2.6-flash在市场上反响良好。

🎯

关键要点

  • 蚂蚁百灵于5月15日开源思考模型Ring-2.6-1T,权重文件已上线Hugging Face和ModelScope平台。
  • Ring-2.6-1T引入可调节的Reasoning Effort机制,支持high与xhigh两种推理强度,适应不同任务需求。
  • high模式适合高频Agent工作流,提升效率;xhigh模式则针对高难任务如数学竞赛和科研分析。
  • Ring-2.6-1T采用异步强化学习训练架构,解决了传统同步训练中的资源等待和吞吐不足问题。
  • 百灵强调模型在真实生产环境中的应用,近期发布的Ling-2.6-flash在市场上反响良好,日均tokens调用量达到100B级别。

延伸问答

Ring-2.6-1T模型的主要特点是什么?

Ring-2.6-1T模型引入了可调节的Reasoning Effort机制,支持high与xhigh两种推理强度,适应不同任务需求。

Ring-2.6-1T在高频工作流中的表现如何?

在high模式下,Ring-2.6-1T适合高频Agent工作流,能够显著提升效率。

Ring-2.6-1T采用了什么样的训练架构?

Ring-2.6-1T采用异步强化学习训练架构,解决了传统同步训练中的资源等待和吞吐不足问题。

Ring-2.6-1T的xhigh模式适合哪些任务?

xhigh模式适合高难任务,如数学竞赛和科研分析,能够释放模型的能力上限。

百灵在模型开发中强调了什么?

百灵强调模型在真实生产环境中的应用,注重Token效率,力求用更少的token完成高质量任务输出。

Ling-2.6-flash的市场反响如何?

Ling-2.6-flash在市场上反响良好,日均tokens调用量达到100B级别,连续多日位列Trending榜首。

➡️

继续阅读