量子位 ·

纯国产万卡集群炼出万亿参数大模型，被这家央企率先做到了！

💡 原文中文，约4700字，阅读约需12分钟。

📝

内容提要

中国电信人工智能研究院成功训练出首个纯国产万亿参数大模型，使用天翼云和自研平台，训练稳定性国际领先。TeleAI开源了千亿参数大模型TeleChat2-115B，并在C-Eval评测中取得第一。模型在长文本写作、会议纪要生成等方面表现出色。

🎯

关键要点

中国电信人工智能研究院成功训练出首个纯国产万亿参数大模型。
训练使用的万卡集群由天翼云提供，训练稳定性国际领先。
TeleAI开源了千亿参数大模型TeleChat2-115B，并在C-Eval评测中取得第一。
TeleChat系列模型在逻辑推理能力方面也曾获得开源大模型排名第一。
星辰语义大模型在长文本写作和会议纪要生成方面表现出色。
实现万卡万参的关键在于提升集群性能和稳定性，采用多维混合并行技术。
训练过程中使用了多副本并行、通信优化和DryRun仿真等关键技术。
TeleAI通过探索Scaling Law和正激励噪声来提升超大参数模型的训练效果。
在数据清洗和混合策略上，TeleAI采用了多种技术以提升预训练数据质量。
模型微调过程中，TeleAI使用了多种指标来筛选高质量数据。
TeleAI重视人才引进，组建了近800人的研发团队，推动大模型的研发。
中国电信在前沿技术上的投入使其在AI领域取得了显著进展。

❓

延伸问答

中国电信人工智能研究院训练的万亿参数大模型有什么特点？

该模型实现了万亿参数的稳定训练，训练稳定性国际领先，平均每周仅有1.5次训练中断。

TeleAI的千亿参数大模型在评测中表现如何？

TeleChat2-115B在C-Eval评测中以86.9分获得第一名。

实现万卡万参的关键技术有哪些？

关键技术包括多维混合并行、通信优化、DryRun仿真等。

星辰语义大模型在实际应用中有哪些功能？

该模型支持长文本写作、会议纪要生成、报表生文等多种功能。

TeleAI是如何提升训练数据质量的？

通过数据清洗、在线领域采样权重调整和合成数据构建等多种技术提升数据质量。

中国电信在AI领域的投入有哪些成果？

中国电信在AI领域取得显著进展，包括发布多个行业大模型和量子计算云平台。

🏷️

标签

C-Eval TeleChat2-115B 万亿参数中国电信人工智能大模型集群

➡️

继续阅读

2026年上半年人工智能的十个关键时刻
2026年上半年，人工智能在软件开发领域引发重大变化。特朗普签署行政命令加强AI安全，AI实验室与芯片制造商紧密合作。Anthropic与OpenAI争夺...
人类证明：如何验证一个人是真实且独特的
在人工智能时代，验证个人的真实性和独特性变得愈加困难。传统的验证方法如IP限制和验证码逐渐失效。文章探讨了“人类证明”的五大支柱：独特性、匿名性、恢复性、...
开发者和专业人士的顶尖AI生产力工具
人工智能已成为提高工作效率的重要工具，帮助人们减少重复性工作，专注于创造性和决策任务。文章介绍了几种实用的AI生产力工具，包括Notion AI用于知识管...
在哪里预购《侠盗猎车手 VI》
《侠盗猎车手 VI》将于2026年11月19日发布，适用于PS5和Xbox Series S/X。游戏有标准版（79.99美元）和终极版（99.99美元）...
缅怀我的父亲
文章讲述了作者与亲人因脑梗而经历的生离死别。亲人手术后病情恶化，最终决定放弃治疗。作者回忆与亲人的情感，感到自责与悲痛，反思未能多陪伴。尽管失去令人心碎，...
微软、AWS和Anthropic正在投入数十亿美元——而不是用于更好的模型
微软成立“前沿公司”，将6,000名专家嵌入客户组织，设计和部署AI系统，投资25亿美元，旨在解决企业AI部署中的工程资源短缺问题。初期客户包括联合利华和...