NVIDIA在日本和台湾推出用于生成式AI的NIM微服务

NVIDIA在日本和台湾推出用于生成式AI的NIM微服务

💡 原文英文,约1000词,阅读约需4分钟。
📝

内容提要

NVIDIA发布了四个新的微服务,支持开发者构建和部署生成式人工智能应用程序。这些微服务支持区域语言模型,提供对当地法律、法规和习俗的更深入理解。模型在语言理解、法律任务、问答和语言翻译方面具有领先的性能。这些微服务经过优化,使用NVIDIA TensorRT-LLM开源库进行推理,可以提供高达5倍的吞吐量。它们以托管的API形式提供,并可在医疗、金融、制造、教育和法律等各个行业中使用。NVIDIA AI Foundry还提供了一个平台,供开发者创建定制的区域语言模型。

🎯

关键要点

  • NVIDIA发布了四个新的微服务,支持开发者构建和部署生成式人工智能应用程序。
  • 这些微服务支持区域语言模型,提供对当地法律、法规和习俗的深入理解。
  • Llama-3-Swallow-70B和Llama-3-Taiwan-70B是针对日本和中文数据训练的区域语言模型。
  • 这些模型在语言理解、法律任务、问答和语言翻译方面具有领先的性能。
  • NIM微服务允许企业、政府机构和大学在自己的环境中托管本地LLM。
  • NIM微服务经过优化,使用NVIDIA TensorRT-LLM开源库进行推理,提供高达5倍的吞吐量。
  • NVIDIA AI Foundry为开发者提供创建定制区域语言模型的平台。
  • 开发者可以轻松部署这些微服务,提升应用程序的性能和用户体验。
  • NIM微服务在医疗、金融、制造、教育和法律等行业中具有广泛应用。
  • 企业需要根据自身业务流程和领域专业知识对区域AI模型进行微调。
➡️

继续阅读