💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
NVIDIA发布了四个新的微服务,支持开发者构建和部署生成式人工智能应用程序。这些微服务支持区域语言模型,提供对当地法律、法规和习俗的更深入理解。模型在语言理解、法律任务、问答和语言翻译方面具有领先的性能。这些微服务经过优化,使用NVIDIA TensorRT-LLM开源库进行推理,可以提供高达5倍的吞吐量。它们以托管的API形式提供,并可在医疗、金融、制造、教育和法律等各个行业中使用。NVIDIA AI Foundry还提供了一个平台,供开发者创建定制的区域语言模型。
🎯
关键要点
- NVIDIA发布了四个新的微服务,支持开发者构建和部署生成式人工智能应用程序。
- 这些微服务支持区域语言模型,提供对当地法律、法规和习俗的深入理解。
- Llama-3-Swallow-70B和Llama-3-Taiwan-70B是针对日本和中文数据训练的区域语言模型。
- 这些模型在语言理解、法律任务、问答和语言翻译方面具有领先的性能。
- NIM微服务允许企业、政府机构和大学在自己的环境中托管本地LLM。
- NIM微服务经过优化,使用NVIDIA TensorRT-LLM开源库进行推理,提供高达5倍的吞吐量。
- NVIDIA AI Foundry为开发者提供创建定制区域语言模型的平台。
- 开发者可以轻松部署这些微服务,提升应用程序的性能和用户体验。
- NIM微服务在医疗、金融、制造、教育和法律等行业中具有广泛应用。
- 企业需要根据自身业务流程和领域专业知识对区域AI模型进行微调。
🏷️
标签
➡️