Shayan Mohanty是Thoughtworks的AI研究负责人,专注于AI开发与生产的基础研究。他曾担任Watchful的CEO,领导数据工程团队,参与多个大型项目。DeepSeek的研究旨在提高大规模语言模型的成本和内存效率,采用HPC协同设计,推动大规模强化学习的推理能力。他的四篇技术报告展示了在模型规模、训练稳定性和数据质量方面的创新。
完成下面两步后,将自动完成登录并继续当前操作。