Nvidia 宣布其 RTX 50 系列 GPU 可加速 DeepSeek 的 AI 模型,但 DeepSeek 的 R1 模型在低成本下表现良好,表明 Nvidia 硬件并非必需。DeepSeek 使用较弱的 H800 GPU 训练模型,R1 现已在 AWS 和 Azure 平台上线。
DeepSeek团队在两个月内利用2048张H800 GPU训练出与顶尖模型相媲美的成果,挑战了传统算力规模观念。翟季冬教授强调,系统软件创新是提升算力效能的关键,需在有限资源下优化算法和软件。目前国内算力资源闲置,亟需探索从应用到芯片的完整链路,以推动AI产业发展。
完成下面两步后,将自动完成登录并继续当前操作。