蚂蚁推出的Ling-2.5-1T模型拥有万亿参数,具备高效执行力和情商,支持复杂推理和长文本处理,优化设计提升了Token效率,适用于多种Agent任务,是开发者可靠的开源选择。
蚂蚁集团开源了全球首个混合线性架构的万亿参数模型Ring-2.5-1T,提升长文本推理效率3倍,达到IMO金牌水平。该模型在数学推理和代码生成等领域表现优异,适配多种智能体框架,解决了长输出场景的计算开销问题。
Amazon EC2 P6-B300实例发布,配备NVIDIA Blackwell Ultra GPU,网络带宽提升2倍,GPU内存提升1.5倍,适合大规模AI应用,特别是复杂技术场景,支持万亿参数模型训练。
蚂蚁集团发布了开源的万亿参数思考模型Ring-1T,具备接近GPT-5的能力,数学推理达到IMO银牌水平。该模型通过自研算法解决训练与推理精度差异,在医疗问答和人类偏好对齐测试中表现优异。Ring-1T是蚂蚁在万亿参数模型上的首次尝试,未来将继续优化。
浪潮信息推出的元脑SD200超节点AI服务器,支持四大国产开源模型同时运行,具备万亿参数推理能力。其64张卡融合为统一内存,采用3D Mesh架构,降低延迟,提升计算效率,满足Agentic AI时代的多模型协作需求。
浪潮信息于8月7日发布了支持万亿参数大模型的“元脑SD200”超节点AI服务器,具备64路本土GPU高速互连和超低延迟通信,已实现商用,性能优异。
浪潮信息的元脑企智一体机已成功适配Kimi K2万亿参数大模型,单用户输出速度达到70 tokens/s。Kimi K2使用MuonClip优化器,参数总量为1万亿,需至少1TB显存,并搭载FP8计算引擎,支持高速并行通信和多用户访问。
中国电信人工智能研究院成功训练出首个纯国产万亿参数大模型,使用天翼云和自研平台,训练稳定性国际领先。TeleAI开源了千亿参数大模型TeleChat2-115B,并在C-Eval评测中取得第一。模型在长文本写作、会议纪要生成等方面表现出色。
本论文提出了一种新的并行计算方法,可以使模型达到拥有万亿参数的级别,并提高了吞吐量。在3072个GPU上完成了1万亿参数模型的训练,每个GPU的吞吐量达到了理论峰值的52%。
完成下面两步后,将自动完成登录并继续当前操作。