NVIDIA Blog ·

OpenAI的新开源模型在NVIDIA GeForce RTX和RTX PRO GPU上实现本地加速

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

NVIDIA与OpenAI合作推出优化的开源gpt-oss模型，支持RTX AI PC，适用于网页搜索和研究，性能可达每秒256个token，开发者可通过Ollama等工具轻松使用，推动AI创新。

🎯

🔎

gpt-oss-20b和gpt-oss-120b模型的发布为开发者提供了多种应用场景，包括网页搜索、编码辅助和文档理解等。这些模型的长上下文支持（最高可达131,072个token）使其在处理复杂问题时表现出色，适合需要深入分析的任务。

Ollama应用程序为用户提供了简便的模型测试方式，特别适合RTX AI PC用户。其优化的用户界面和对PDF、文本文件的支持，使得与模型的交互更加直观和高效，降低了技术门槛，鼓励更多开发者参与AI创新。

OpenAI与NVIDIA的合作推出这些开源模型，标志着AI技术的进一步民主化。开发者可以在本地环境中自由使用这些模型，推动AI在各个领域的应用，增强美国在全球技术领导力的地位。

❓

新开源模型包括gpt-oss-20b和gpt-oss-120b，支持链式思维能力和可调推理努力水平，最长支持131,072的上下文长度。

用户只需安装Ollama应用，选择模型并发送消息，无需额外配置即可实现最佳性能。

这些模型适合网页搜索、编码辅助、文档理解和深入研究等任务。

这次合作推动了开源软件的创新，强化了美国在AI技术领域的领导地位。

Ollama支持PDF和文本文件聊天，提供多模态支持和可定制的上下文长度。

开发者可以通过命令行接口或SDK调用模型，增强应用程序和工作流程。

🏷️