标签

 llm 

相关的文章:

本列表汇集了关于大语言模型(LLM)的最新研究与实践,涵盖其原理、应用及未来发展趋势,助您深入了解这一领域的前沿动态。

NVIDIA AI 发布 Canary-Qwen-2.5B:一款先进的 ASR-LLM 混合模型,在 OpenASR 排行榜上拥有 SoTA 性能

NVIDIA 刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别 (ASR) 和语言模型 (LLM) 混合模型,目前以创纪录的 5.63% 的词错率 (WER...

NVIDIA发布了Canary-Qwen-2.5B模型,词错率为5.63%,在Hugging Face OpenASR中排名第一。该模型结合了自动语音识别和语言模型,支持音频摘要和问答,适用于多个行业,具有商业和开源特性。

NVIDIA AI 发布 Canary-Qwen-2.5B:一款先进的 ASR-LLM 混合模型,在 OpenASR 排行榜上拥有 SoTA 性能
原文中文,约2100字,阅读约需5分钟。发表于:
阅读原文
发表于:
阅读原文
发表于:
阅读原文
发表于:
阅读原文

Liquid AI 开源 LFM2:新一代边缘 LLM

随着 Liquid AI 发布其第二代 Liquid Foundation 模型 LFM2,设备端人工智能领域取得了重大飞跃。这一系列全新的生成式 AI 模型代表了边缘计算的范式转...

Liquid AI 发布了第二代 Liquid Foundation 模型 LFM2,显著提升了设备端 AI 性能,尤其在实时应用中的解码和预填充速度。LFM2 采用混合架构,结合卷积和注意力机制,训练速度提高三倍,支持毫秒级延迟和数据隐私,适用于多种边缘设备。

Liquid AI 开源 LFM2:新一代边缘 LLM
原文中文,约2200字,阅读约需6分钟。发表于:
阅读原文
原文中文,约2200字,阅读约需6分钟。发表于:
阅读原文

LLM Paper&Practice: CAMEL 和 AutoGen

本文是我在阅读《大模型应用开发 动手做AI Agent》时,对书中推荐的几篇核心论文的理解与总结,主要聚焦于CAMEL和 AutoGen 这两种范式,都是用来实现 MultiAgent 的。 1. CAMEL 1.1. 什么是 CAMEL? CAMEL 是 Communicative Agents for “Mind” Exploration of Large Language Model...

本文总结了《大模型应用开发 动手做AI Agent》中CAMEL和AutoGen两种多智能体框架的核心思想。CAMEL强调智能体自主合作,减少人类干预;AutoGen则支持灵活的人机协作,允许人类随时介入。两者在设计哲学和实践中各有优劣,面临系统可靠性、成本和上下文管理等挑战。

LLM Paper&Practice: CAMEL 和 AutoGen
原文中文,约10700字,阅读约需26分钟。发表于:
阅读原文

大模型从零到一:LLM 原理与实践指南 | 开源日报 No.662

datawhalechina/happy-llm happy-llm 是一个从零开始系统讲解大语言模型(LLM)原理与实践的中文教程项目。 深入解析 Transformer 架构和注意力机制,帮助理解 LLM 的核心技术 详细介绍预训练语言模型及主流大模型结构 手把手指导基于 PyTorch 搭建并训练完整的 LLaMA2...

happy-llm 是一个中文教程项目,介绍大语言模型的原理与实践,涵盖 Transformer 架构、预训练模型及 LLaMA2 的搭建与训练,适合有编程基础的 NLP 爱好者。

大模型从零到一:LLM 原理与实践指南 | 开源日报 No.662
原文中文,约1000字,阅读约需3分钟。发表于:
阅读原文

大语言模型(LLM)到底是怎么运作的?(配图通俗讲解)

* LLM本质上是学习单词序列的条件概率。 * 每次预测下一个单词时,会根据已出现的上下文计算条件概率。 * 使用温度(Temperature)是为了控制生成结果的多样性和创造性。

条件概率是指在已知某事件发生的情况下,另一个事件发生的概率。大语言模型(LLM)通过学习单词序列的条件概率来预测下一个单词,并通过温度调节生成内容的多样性与创造性。

大语言模型(LLM)到底是怎么运作的?(配图通俗讲解)
原文中文,约1200字,阅读约需3分钟。发表于:
阅读原文

Point-3D LLM:研究令牌结构对大型语言模型3D场景理解的影响

Effectively representing 3D scenes for Multimodal Large Language Models (MLLMs) is crucial yet challenging. Existing approaches commonly only rely on 2D image features and use varied tokenization...

有效的3D场景表示对多模态大型语言模型至关重要。本文比较了视频和点云表示,提出了一种结合3D点云特征的新方法,显著提升了性能。实验结果表明,经过巧妙采样和排序的点基结构在多个3D理解基准上表现优异,能够与视频基结构相媲美。

Point-3D LLM:研究令牌结构对大型语言模型3D场景理解的影响
原文英文,约300词,阅读约需1分钟。发表于:
阅读原文