Nvidia推出的Nemotron 3 Ultra现已在Vercel AI Gateway上可用。这是一种开放的混合专家推理模型,专为长时间运行的代理工作流设计,具有1M的上下文窗口,支持多轮代理工作流,吞吐量可达每秒350个标记,成本降低30%。使用时需在AI SDK中设置模型为nvidia/nemotron-3-ultra-550b-a55b。
完成下面两步后,将自动完成登录并继续当前操作。