机器之心 ·

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

英伟达开源了大模型Llama-3.1-Nemotron-70B-Instruct，其性能仅次于OpenAI最新模型，并在多个基准测试中表现优异。英伟达还开源了训练数据集HelpSteer2和奖励模型。该模型使用RLHF技术训练，需特定硬件部署。

🎯

🔎

Llama-3.1-Nemotron-70B-Instruct在多个基准测试中表现优异，尤其在Arena Hard基准上得分85.0，显示出其在通用领域的强大能力。然而，英伟达尚未针对数学等专业领域进行优化，用户在使用时需注意模型在特定领域的局限性。

英伟达开源的HelpSteer2训练数据集包含21362个提示响应，旨在提高模型的实用性和连贯性。这一数据集的质量直接影响模型的表现，用户在选择使用时应关注数据集的构建和训练策略，以确保生成的内容符合实际需求。

部署Llama-3.1-Nemotron-70B-Instruct需要特定的硬件支持，至少需要4个40GB或2个80GB的NVIDIA GPU。这一要求可能限制了部分用户的使用，尤其是小型企业或个人开发者在资源配置上的挑战。

❓

Llama-3.1-Nemotron-70B-Instruct的性能仅次于OpenAI最新模型，在多个基准测试中表现优异，尤其在Arena Hard基准上得分为85.0。

英伟达开源了训练数据集HelpSteer2，包含21362个提示响应和20324个用于训练的提示响应。

该模型使用了RLHF技术进行训练，主要采用REINFORCE算法。

部署该模型至少需要4个40GB或2个80GB的NVIDIA GPU，以及150GB的可用磁盘空间。

Llama-3.1-Nemotron-70B-Reward模型用于预测LLM生成的响应质量，并在多个榜单中表现出色。

截至2024年10月1日，该模型在三个自动对齐基准中均排名第一，击败了GPT-4o和Claude 3.5 Sonnet等模型。

🏷️