小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
NVIDIA AI 发布 Nemotron Speech ASR:全新的开源实时转录模型

NVIDIA发布了Nemotron语音识别模型,专为低延迟语音助手和实时字幕设计。该模型采用缓存感知的FastConformer编码器和RNNT解码器,支持16 kHz音频,提供多种输入块配置,词错误率在7.2%至7.8%之间,显著提升了并发性和稳定性,适用于实时语音应用。

NVIDIA AI 发布 Nemotron Speech ASR:全新的开源实时转录模型

实时互动网
实时互动网 · 2026-01-08T02:51:11Z
LWiAI 播客第229期 - Gemini 3 Flash、ChatGPT 应用、Nemotron 3

本期节目回顾了上周的重要AI新闻,包括OpenAI发布的GPT-5.2 Codex和Google的Gemini Free Flash。Nvidia推出的新开源Trion-3模型表现优异。Lovable获得3.3亿美元B轮融资,估值66亿美元;Faya获得1.4亿美元D轮融资,估值45亿美元。此外,中国在半导体技术上取得进展,华为和中芯国际推动EUV光刻机的发展。

LWiAI 播客第229期 - Gemini 3 Flash、ChatGPT 应用、Nemotron 3

Last Week in AI
Last Week in AI · 2025-12-25T21:29:26Z

英伟达成开源新王?Nemotron 3全新混合专家架构,推理效率升4倍

机器之心
机器之心 · 2025-12-16T09:02:22Z
Nvidia推出下一代Nemotron模型

Nvidia推出Nemotron 3系列AI模型,包括Nano、Super和Ultra,首次发布三万亿个预训练数据和1800万后训练样本。Nano模型现已可用,Super和Ultra预计2026年上半年发布。新模型采用专家混合技术,提升性能并降低成本,支持多种应用,开发者可通过开源和商业平台使用。

Nvidia推出下一代Nemotron模型

The New Stack
The New Stack · 2025-12-15T14:30:47Z
在vLLM上运行高效且准确的AI代理,使用NVIDIA Nemotron 3 Nano

NVIDIA推出Nemotron 3 Nano,采用混合Mamba-Transformer MoE架构,支持1M上下文长度,适合高效AI应用。该模型开源,具备出色的编码和推理能力,适用于多行业AI代理开发。

在vLLM上运行高效且准确的AI代理,使用NVIDIA Nemotron 3 Nano

vLLM Blog
vLLM Blog · 2025-12-15T00:00:00Z
在vLLM上运行NVIDIA Nemotron的多模态推理代理

NVIDIA推出Nemotron Nano 2 VL模型,支持视频理解和文档智能,采用混合Transformer-Mamba架构,具备高效视频采样技术,提升处理效率和准确性,适用于多模态应用。

在vLLM上运行NVIDIA Nemotron的多模态推理代理

vLLM Blog
vLLM Blog · 2025-10-31T00:00:00Z
现在提供NVIDIA Nemotron与vLLM

Agentic AI系统通过推理、规划和自主行动推动开发者应用进步。NVIDIA的Nemotron系列模型为开发者提供高效、准确的推理工具,适用于数据中心和边缘硬件。最新的Nemotron Nano 2模型具备混合架构和可调思维预算,优化了推理成本和准确性,适合多种任务。

现在提供NVIDIA Nemotron与vLLM

vLLM Blog
vLLM Blog · 2025-10-23T00:00:00Z
开放的秘密:NVIDIA Nemotron模型、数据集和技术如何推动AI发展

NVIDIA的Nemotron系列开放源代码技术支持开发者和企业构建通用及专业智能,提供多模态AI模型、数据集和工具,促进各行业AI应用的开发与部署。其透明性使用户能够理解模型的工作原理,广泛应用于制造、医疗和教育等领域。

开放的秘密:NVIDIA Nemotron模型、数据集和技术如何推动AI发展

NVIDIA Blog
NVIDIA Blog · 2025-09-24T21:45:24Z
跨越群岛:UK-LLM将人工智能引入英国语言,借助英伟达Nemotron

伦敦大学学院、英伟达与班戈大学合作开发的新模型,利用英伟达的Nemotron技术,支持威尔士语及其他英国语言的人工智能推理,旨在改善医疗、教育和法律等公共服务。该项目希望到2050年实现威尔士语百万说话者的目标,促进语言的活跃使用。

跨越群岛:UK-LLM将人工智能引入英国语言,借助英伟达Nemotron

NVIDIA Blog
NVIDIA Blog · 2025-09-14T01:00:21Z

NVIDIA推出了轻量级大语言模型Nemotron-Nano-9B-v2,结合Mamba和Transformer技术,支持128K超长上下文,推理能力强,适合小型设备。该模型在准确率和吞吐量上优于同规模的开源模型,标志着轻量化部署的突破。

在线教程丨英伟达力推小模型,小而精的Nemotron-Nano-9B-v2比Qwen3快6倍

HyperAI超神经
HyperAI超神经 · 2025-08-29T03:35:54Z
NVIDIA AI 发布 Jet-Nemotron:速度提升 53 倍的混合架构语言模型系列,可降低大规模推理成本 98%

NVIDIA发布了Jet-Nemotron模型系列,利用后神经架构搜索技术显著提升了大语言模型的生成吞吐量,达到53.6倍,同时保持或超越准确率。这一创新降低了计算和内存成本,使得边缘设备的大规模部署成为可能,提升了AI应用的经济性和效率。

NVIDIA AI 发布 Jet-Nemotron:速度提升 53 倍的混合架构语言模型系列,可降低大规模推理成本 98%

实时互动网
实时互动网 · 2025-08-27T02:27:39Z
CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

开放推理模型提升了AI代理的智能决策能力,预计到2028年将为企业创造4500亿美元收益。NVIDIA推出的Nemotron和Cosmos模型增强了AI代理的推理能力,助力企业提高生产力,尤其在科学推理和编码等复杂任务的自动化决策中表现突出。

CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

NVIDIA Blog
NVIDIA Blog · 2025-08-11T15:00:13Z
NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5:为推理和代理 AI 树立新标准

NVIDIA 最新发布的 Llama Nemotron Super v1.5 在推理和效率上取得显著进展,特别适合复杂的科学和编码任务。该模型通过高信号数据集优化和神经架构搜索,提升了吞吐量和准确性,适合个人开发者和企业应用,促进了社区反馈和定制,标志着 AI 推理模型的新纪元。

NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5:为推理和代理 AI 树立新标准

实时互动网
实时互动网 · 2025-07-29T02:51:21Z
NVIDIA AI 发布 Llama Nemotron Nano VL:专为文档理解而优化的紧凑型视觉语言模型

NVIDIA推出了Llama Nemotron Nano VL,这是一种高效的视觉语言模型,专注于文档理解,基于Llama 3.1架构,结合轻量级视觉编码器,支持多模态输入,优化标记推理。该模型在OCRBench v2中表现优异,适用于自动文档问答和智能OCR等应用。

NVIDIA AI 发布 Llama Nemotron Nano VL:专为文档理解而优化的紧凑型视觉语言模型

实时互动网
实时互动网 · 2025-06-05T02:15:19Z
NVIDIA 发布 Llama Nemotron Nano 4B:针对边缘 AI 和科学任务优化的高效开放推理模型

NVIDIA 发布了 Llama Nemotron Nano 4B,这是一个专注于科学任务和编程的开源推理模型,具有 40 亿个参数,推理吞吐量提高 50%,支持长文档和多轮推理,适合低功耗设备,适用于隐私和成本敏感的应用。

NVIDIA 发布 Llama Nemotron Nano 4B:针对边缘 AI 和科学任务优化的高效开放推理模型

实时互动网
实时互动网 · 2025-05-26T02:14:23Z
Llama-Nemotron:高效推理大模型的技术突破与应用前景

NVIDIA发布的Llama-Nemotron系列模型在推理效率和用户控制方面取得突破,支持动态切换推理模式,显著提升性能。该模型优化了架构和训练流程,适用于教育、科研和企业应用,推动开源社区发展。

Llama-Nemotron:高效推理大模型的技术突破与应用前景

我爱自然语言处理
我爱自然语言处理 · 2025-05-06T10:21:46Z

公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族

机器之心
机器之心 · 2025-05-06T08:21:38Z
Llama-Nemotron:2.5倍速度提升的AI推理,保持准确性

Llama-Nemotron是一种高效推理模型,通过垂直压缩和FFN融合实现2.5倍速度提升,保持准确性,优化资源效率,适用于推理和数学任务。

Llama-Nemotron:2.5倍速度提升的AI推理,保持准确性

DEV Community
DEV Community · 2025-05-05T13:43:38Z
Nvidia Nemotron模型旨在加速AI代理的发展

Nvidia推出Llama Nemotron和Cosmos Nemotron模型,强调AI代理在客户支持和欺诈检测中的应用。这些模型有Nano、Super和Ultra三种尺寸,结合语言能力和环境感知,能够自主执行复杂任务,提升实时视频分析能力,帮助检测事件和减少缺陷。

Nvidia Nemotron模型旨在加速AI代理的发展

InfoQ
InfoQ · 2025-01-11T21:00:00Z
NVIDIA宣布推出Nemotron模型系列,以推动智能代理AI的发展

NVIDIA推出Llama Nemotron和Cosmos Nemotron模型,帮助企业开发智能AI代理,提升生产力并解决复杂问题。这些模型在计算效率和准确性上进行了优化,适用于客户支持和视频分析等多种场景,企业可根据需求进行定制,推动业务转型。

NVIDIA宣布推出Nemotron模型系列,以推动智能代理AI的发展

NVIDIA Blog
NVIDIA Blog · 2025-01-07T02:30:50Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码