Nvidia发布了Nemotron 3 Ultra模型,拥有5500亿参数,支持高达100万标记的上下文窗口。该模型速度显著提升,能节省用户30%的成本。尽管在某些基准测试中落后于中国模型,但在处理复杂任务和多语言支持方面表现出色。模型的权重和数据集将公开。
Nvidia推出的Nemotron 3 Ultra现已在Vercel AI Gateway上可用。这是一种开放的混合专家推理模型,专为长时间运行的代理工作流设计,具有1M的上下文窗口,支持多轮代理工作流,吞吐量可达每秒350个标记,成本降低30%。使用时需在AI SDK中设置模型为nvidia/nemotron-3-ultra-550b-a55b。
完成下面两步后,将自动完成登录并继续当前操作。