阶跃新模型快到“没推理”!印奇上任,果然气势一新

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

阶跃新模型Step 3.5 Flash发布,参数为196B,推理峰值达到350TPS,支持256K上下文。与多家芯片厂商兼容,表现优异,采用MoE架构以优化计算成本和增强推理能力,未来将推出Step 4。

🎯

关键要点

  • 阶跃新模型Step 3.5 Flash发布,参数为196B,推理峰值达到350TPS,支持256K上下文。
  • 新模型与多家芯片厂商兼容,表现优异,采用MoE架构以优化计算成本和增强推理能力。
  • Step 3.5 Flash在推理、编码、智能体三大核心场景的基准测试中表现出色,推理类测试排名前列。
  • 模型在推理速度上表现极快,能够准确秒回答案。
  • Step 3.5 Flash支持云端与本地协同,确保数据隐私不出本地。
  • 模型采用MoE稀疏混合专家架构,实际推理中仅激活约11B参数,控制计算与部署成本。
  • 研发团队优化了长上下文处理,增强了模型的表征能力和推理效率。
  • Step 4正在训练中,未来将继续推出新版本。

延伸问答

阶跃新模型Step 3.5 Flash的主要参数是什么?

Step 3.5 Flash的总参数为196B,激活参数为11B,支持256K上下文窗口。

Step 3.5 Flash在推理速度上表现如何?

Step 3.5 Flash的推理峰值达到350TPS,推理速度极快,能够准确秒回答案。

新模型如何优化计算成本?

Step 3.5 Flash采用MoE稀疏混合专家架构,实际推理中仅激活约11B参数,从而控制计算与部署成本。

Step 3.5 Flash在基准测试中的表现如何?

在推理、编码、智能体三大核心场景的基准测试中,Step 3.5 Flash在推理类测试中排名前列,得分97.3。

Step 3.5 Flash如何确保数据隐私?

该模型支持云端与本地协同,确保数据隐私不出本地。

未来的Step 4模型有什么计划?

Step 4正在训练中,未来将继续推出新版本。

➡️

继续阅读