蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

蚂蚁集团发布了开源的万亿参数思考模型Ring-1T,具备接近GPT-5的能力,数学推理达到IMO银牌水平。该模型通过自研算法解决训练与推理精度差异,在医疗问答和人类偏好对齐测试中表现优异。Ring-1T是蚂蚁在万亿参数模型上的首次尝试,未来将继续优化。

🎯

关键要点

  • 蚂蚁集团发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5。

  • Ring-1T在IMO数学能力测试中达到银牌水平,成为首个能拿IMO国际奥数奖的开源系统。

  • 模型在医疗问答和人类偏好对齐测试中表现优异,成功率居于开源模型榜首。

  • Ring-1T采用自研的“棒冰(icepop)”算法解决训练与推理精度差异问题。

  • 模型继续采用Ling 2.0架构,经过多阶段训练显著提升复杂推理能力。

  • Ring-1T是蚂蚁在万亿参数模型上的首次尝试,未来将继续优化模型性能。

  • 用户可通过HuggingFace等平台下载并体验Ring-1T模型。

延伸问答

Ring-1T模型的主要特点是什么?

Ring-1T模型具备接近GPT-5的能力,数学推理达到IMO银牌水平,并在医疗问答和人类偏好对齐测试中表现优异。

Ring-1T是如何解决训练与推理精度差异的问题的?

Ring-1T采用自研的“棒冰(icepop)”算法,通过带掩码的双向截断技术冻结训练-推理分布差异,确保训练稳定。

用户如何获取Ring-1T模型?

用户可以通过HuggingFace、魔搭社区等平台下载Ring-1T模型,并通过蚂蚁百宝箱在线体验。

Ring-1T在IMO数学能力测试中的表现如何?

Ring-1T在IMO测试中仅用一次解出了多个题目,达到银牌水平,是首个能拿IMO国际奥数奖的开源系统。

Ring-1T模型的训练架构是什么?

Ring-1T继续采用Ling 2.0架构,结合高度稀疏的MoE架构和多阶段训练方法,提升复杂推理能力。

蚂蚁集团在万亿参数模型方面的进展如何?

蚂蚁集团已发布18款模型,形成从160亿到1万亿参数的大语言模型产品矩阵,Ring-1T是其首次尝试万亿参数思考模型。

➡️

继续阅读