G42、Cerebras Systems与MBZUAI联合推出K2 Think V2,这是一个基于IFM的700亿参数高级推理系统,标志着真正的端到端开源和开放式推理系统的重大进展。
Cerebras Systems 实现了推理速度提升三倍,使用 Llama 3.1-70B 模型每秒处理 2,100 个 Token,速度比最快 GPU 快 16 倍。通过优化算法和异步计算,显著提升了 AI 在医疗和实时通信等领域的应用效率。
英伟达在AI芯片市场占据90%份额,但Cerebras Systems推出的Llama 3.1-8B AI推理解决方案输出速度是英伟达GPU的20倍。Cerebras的CS-3是现存最快的AI计算机,其芯片设计能够提高信息处理速度。AI推理市场需求增长,许多公司挑战英伟达的地位。
完成下面两步后,将自动完成登录并继续当前操作。