阶跃新模型快到“没推理”!印奇上任,果然气势一新
💡
原文中文,约2500字,阅读约需6分钟。
📝
内容提要
阶跃新模型Step 3.5 Flash发布,参数为196B,推理峰值达到350TPS,支持256K上下文。与多家芯片厂商兼容,表现优异,采用MoE架构以优化计算成本和增强推理能力,未来将推出Step 4。
🎯
关键要点
- 阶跃新模型Step 3.5 Flash发布,参数为196B,推理峰值达到350TPS,支持256K上下文。
- 新模型与多家芯片厂商兼容,表现优异,采用MoE架构以优化计算成本和增强推理能力。
- Step 3.5 Flash在推理、编码、智能体三大核心场景的基准测试中表现出色,推理类测试排名前列。
- 模型在推理速度上表现极快,能够准确秒回答案。
- Step 3.5 Flash支持云端与本地协同,确保数据隐私不出本地。
- 模型采用MoE稀疏混合专家架构,实际推理中仅激活约11B参数,控制计算与部署成本。
- 研发团队优化了长上下文处理,增强了模型的表征能力和推理效率。
- Step 4正在训练中,未来将继续推出新版本。
➡️