NVIDIA Blog ·

新款NVIDIA Nemotron 3 Super为智能代理AI提供5倍更高的吞吐量

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

NVIDIA推出的Nemotron 3 Super模型拥有1200亿参数，支持复杂多智能体系统，具备高效推理能力和1百万token的上下文窗口，避免目标漂移，广泛应用于多个行业，提升工作效率，支持开发者自定义和部署。

🎯

🔎

在多智能体应用中，目标漂移和上下文爆炸是主要挑战。Nemotron 3 Super通过提供100万token的上下文窗口，有效解决了这些问题，使得智能体能够保持任务一致性，提升工作效率。开发者在设计多智能体系统时，应关注这些技术特性，以优化系统性能。

Nemotron 3 Super以开放权重发布，允许开发者在不同环境中进行定制和部署。这种开放性不仅促进了创新，还使得企业能够根据自身需求灵活调整模型，降低了使用门槛。开发者应利用这一优势，探索模型在特定行业中的应用潜力。

Nemotron 3 Super被多个行业的领导者如Amdocs和Palantir部署，显示出其在电信、网络安全等领域的广泛适用性。企业在考虑引入此类模型时，应评估其在特定行业中的实际应用案例，以确保投资的有效性和回报。

❓

该模型拥有1200亿参数，支持复杂多智能体系统，具备高效推理能力和100万token的上下文窗口。

它的100万token上下文窗口允许代理保持完整的工作状态，从而防止目标漂移。

电信、网络安全、半导体设计和制造等行业的领导者正在部署和定制该模型以自动化工作流程。

该架构提供高达5倍的吞吐量和2倍的准确性，优化了内存和计算效率。

开发者可以通过NVIDIA的多个平台获取该模型，并在工作站、数据中心或云中进行部署和定制。

该模型通过多词预测技术实现了3倍更快的推理速度，并在NVIDIA Blackwell平台上运行时速度提升可达4倍。

🏷️