NVIDIA Blog ·

小而强大：NVIDIA加速Microsoft的开放Phi-3 Mini语言模型

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

NVIDIA加速了Microsoft的Phi-3 Mini开放语言模型，并使用NVIDIA TensorRT-LLM进行优化。Phi-3 Mini具有10倍大模型的能力，可用于研究和商业用途。Phi-3 Mini有两个变体，一个支持4k tokens，另一个支持128K tokens。开发者可以在ai.nvidia.com上尝试Phi-3 Mini，并在Jetson AI Lab上学习部署。TensorRT-LLM将支持Phi-3 Mini的长上下文窗口，并提供多种优化和内核。NVIDIA是开源生态系统的积极贡献者，并与Microsoft合作加速DirectML、Azure云、生成AI研究、医疗和生命科学等创新。

🎯

关键要点

NVIDIA加速了Microsoft的Phi-3 Mini开放语言模型，并使用NVIDIA TensorRT-LLM进行优化。
Phi-3 Mini具有10倍大模型的能力，适用于研究和商业用途。
该模型有两个变体，一个支持4k tokens，另一个支持128K tokens，适合处理长上下文。
开发者可以在ai.nvidia.com上尝试Phi-3 Mini，并在Jetson AI Lab上学习部署。
Phi-3 Mini模型有3.8亿参数，训练使用了3.3万亿tokens，仅用七天时间在512个NVIDIA H100 Tensor Core GPUs上完成。
Phi-3 Mini适合在边缘设备上高效运行，能够在资源受限的情况下执行简单任务。
TensorRT-LLM支持Phi-3 Mini的长上下文窗口，并使用多种优化和内核提高推理吞吐量和延迟。
NVIDIA积极参与开源生态系统，发布了超过500个开源项目，并支持多个外部项目。
NVIDIA与Microsoft的长期合作推动了DirectML、Azure云、生成AI研究及医疗生命科学等创新。

❓

延伸问答

Phi-3 Mini模型的主要特点是什么？

Phi-3 Mini模型具有3.8亿参数，支持4k和128K tokens的变体，能够处理长上下文，适用于研究和商业用途。

NVIDIA如何优化Phi-3 Mini模型？

NVIDIA使用TensorRT-LLM对Phi-3 Mini进行优化，以提高推理吞吐量和降低延迟。

开发者如何使用Phi-3 Mini模型？

开发者可以在ai.nvidia.com上尝试Phi-3 Mini，并在Jetson AI Lab上学习如何部署该模型。

Phi-3 Mini模型适合哪些应用场景？

Phi-3 Mini适合在边缘设备上运行，尤其是在资源受限的情况下执行简单任务。

NVIDIA在开源生态系统中的贡献有哪些？

NVIDIA发布了超过500个开源项目，并支持多个外部项目，如JAX、Kubernetes和PyTorch。

Phi-3 Mini模型的训练过程是怎样的？

Phi-3 Mini模型在512个NVIDIA H100 Tensor Core GPUs上，仅用七天时间训练了3.3万亿tokens。

🏷️

继续阅读

【Rust日报】2026-06-05 NVIDIA OpenShell：AI Agent 的安全私有运行时
NVIDIA 开源了 OpenShell，一个为 AI Agent 设计的安全沙箱运行时，防止未授权访问和数据泄露。每个 Agent 在独立容器中运行，支...
首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
Nvidia最新模型现已上线
Nvidia发布了Nemotron 3 Ultra模型，拥有5500亿参数，支持高达100万标记的上下文窗口。该模型速度显著提升，能节省用户30%的成本。...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
SuperX将在Interop Tokyo 2026发布1.6T光模块解决方案
SuperX将在2026年Interop Tokyo发布1.6T光模块解决方案，专为大规模AI训练与推理设计，支持数字信号处理和硅光技术。展会将展示多种A...
我们在2026年5月发布的最新AI新闻
May AI recap