小红花·文摘

Kimi K2官方技术报告揭示其训练方法，使用384个专家和NVIDIA H800 GPU集群，强调“用自己的话再讲一遍”以提升模型理解。Kimi K2在代码和数学推理等任务中表现优异，超越DeepSeek，成为全球最强开源模型。核心创新包括MuonClip优化器和大规模数据合成，确保高效训练和性能提升。