小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

企业结合小型语言模型(SLM)与检索增强生成(RAG)架构,能有效降低基础设施成本,提高响应准确性和可审计性。SLM专注于特定领域,适合企业平台的可持续运行,而RAG通过引用权威数据源增强输出可信度。模块化代理架构使每个代理独立负责特定功能,便于扩展、治理,确保合规性和操作控制。

通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

The New Stack
The New Stack · 2026-01-10T18:00:27Z

本文探讨了NVIDIA的小模型(SLM)在AI代理中的未来,认为SLM在性能、经济性和适应性方面优于大模型(LLM),能够高效处理特定任务,降低成本并提高灵活性。未来AI架构将从“大模型单体”转向“小模型微服务”,实现更高效的系统设计。

NVIDIA 的颠覆性观点:AI Agent 的未来,属于小模型 (SLM)

Tony Bai
Tony Bai · 2025-07-04T14:02:13Z
为什么小型语言模型(SLM)有望重新定义 Agentic AI:效率、成本和实际部署

随着Agentic AI系统的发展,研究表明小型语言模型(SLM)在效率和经济性上优于大型模型(LLM),更适合大多数代理操作。建议采用模块化系统,优先使用SLM,必要时再使用LLM,以提升AI系统的可持续性和灵活性。

为什么小型语言模型(SLM)有望重新定义 Agentic AI:效率、成本和实际部署

实时互动网
实时互动网 · 2025-06-19T03:16:16Z

本研究提出了一种新方法,将阿拉伯语整合进以英语为主的小型开源模型,成功训练出Kuwain模型,参数达到1.5亿,阿拉伯语性能提升了8%。

Kuwain 1.5B:通过语言注入构建阿拉伯语SLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z
Zoho、Zoom 准备发布小型语言模型 (SLM)

Zoho 和 Zoom 正在开发小型语言模型 (SLM),旨在提高效率并降低资源消耗。Zoho 计划在未来 12 个月内推出 SLM,并与客户进行测试以确保准确性。Zoom 也在开发 SLM,强调其成本效益和性能优化。两家公司希望通过 SLM 满足企业对自动化的需求。

Zoho、Zoom 准备发布小型语言模型 (SLM)

实时互动网
实时互动网 · 2025-03-07T02:25:17Z
播客:2024年关键趋势:基于单元的架构、DORA与SPACE、LLM与SLM、云数据库与门户

在2024年回顾中,Daniel Bryant与InfoQ播客主持人探讨了软件架构、文化、AI和数据工程的趋势,强调了AI普及、绿色软件关注、平台工程崛起及人类与技术发展的平衡挑战。

播客:2024年关键趋势:基于单元的架构、DORA与SPACE、LLM与SLM、云数据库与门户

InfoQ
InfoQ · 2024-12-30T10:00:00Z
Google DeepMind 推出“SALT”:一种使用 SLM 高效训练高性能大型语言模型的机器学习方法

大型语言模型(LLM)在对话代理和内容创建中至关重要,但训练成本高。谷歌研究院提出SALT方法,通过小型模型(SLM)辅助LLM训练,降低计算需求28%,提升模型质量。SALT采用两阶段流程,初期利用SLM指导LLM,后期进行自监督学习,确保LLM专注于高价值数据,为资源有限的机构提供新的训练思路。

Google DeepMind 推出“SALT”:一种使用 SLM 高效训练高性能大型语言模型的机器学习方法

实时互动网
实时互动网 · 2024-12-20T03:23:45Z
为什么要在本地运行LLM/SLM

用户数据和聊天记录保存在本地,确保隐私,无月费或按需付费,降低成本。支持高级配置和离线功能,避免网络问题。流行的本地LLM工具如LM Studio和GPT4ALL,帮助用户控制数据和费用。

为什么要在本地运行LLM/SLM

DEV Community
DEV Community · 2024-12-11T21:32:18Z
研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

AIxiv专栏促进了学术交流,报道了2000多篇文章。小型语言模型(SLMs)因其低延迟和成本效益而受到关注,适合资源有限的环境,并在特定任务上表现出色。本文探讨了SLMs的定义、增强方法、应用及可信赖性,强调了其在未来研究中的重要性。

研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

机器之心
机器之心 · 2024-11-24T13:32:00Z

本研究提出Align-SLM框架,通过偏好优化提升无文本口语语言模型(SLMs)的语义理解,解决其在语义连贯性和相关性方面的不足。实验结果表明,该方法在大多数基准测试中达到了SLMs的最新性能。

Align-SLM: Reinforcement Learning for Textless Spoken Language Models Based on AI Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
大模型已过时,小模型SLM才是未来?苹果正在研究这个

小型语言模型(SLM)因其高效性和适应性,成为AI研究的热门方向。苹果的研究指出,采用FlashAttention和分布式数据并行(DDP)可以显著提高SLM的训练效率,且SLM在性能上与大型模型相当,更适合资源有限的组织。

大模型已过时,小模型SLM才是未来?苹果正在研究这个

机器之心
机器之心 · 2024-10-31T02:18:00Z

本文讨论了微软的Phi模型在小语言模型(SLM)家族中的优秀性能和多模态能力。Phi模型具有不同的参数规模和能力,包括Phi-1、Phi-1.5、Phi-2、Phi-3和Phi-3.5等多个代系。文章还介绍了Phi模型的需求和应用场景,以及一些“黑科技”如LongRoPE、MoE混合专家、DeepSpeed和Flash Attention等。此外,文章还提到了Phi模型与CLIP模型的结合以及Flash Attention技术的应用。

五分钟——了解SLM的优异代表Phi

dotNET跨平台
dotNET跨平台 · 2024-09-03T00:00:35Z

微软将举办全球RAG黑客马拉松活动,参赛者有机会赢取数字勋章和500美元奖金。活动前,微软将提供4期RAG分享课程,帮助参赛者准备。

活动预告 | Global RAG Hack Together Ⅲ-用VS Code AI Tools结合SLM构建RAG应用

dotNET跨平台
dotNET跨平台 · 2024-08-25T00:00:21Z

本文介绍了使用C#和ONNX来玩转Phi-3 SLM LLM的方法,Phi-3 SLM是由Microsoft开发的模型,可以在普通设备上运行。ONNX是一个开放的标准,用于操作机器学习模型,并在不同的框架间进行互操作。文章还介绍了如何下载LLM模型和使用ONNX模型的示例控制台应用程序。最后,提到了使用Phi-3和Phi-3 Vision进行问答和图像分析的示例项目。

使用 C# 和 ONNX 來玩转Phi-3 SLM

dotNET跨平台
dotNET跨平台 · 2024-08-04T23:18:15Z

Phi-3 SLM 是微软开发的 AI 模型,可以在计算机和手机等设备上运行。它与 ONNX 结合,实现 AI 的互操作性,并为 ONNX Runtime 提供优化的模型。C# 开发人员可以在本地 AI 开发中利用 ONNX,以简化模型部署并提高性能。HuggingFace 提供了各种 Phi-3 模型供下载,具有不同的令牌长度。Phi-3 Cookbook 仓库展示了如何在 .NET 应用程序中使用 ONNX 模型来执行问答和图像分析等任务。

使用 C# 和 ONNX 來玩转Phi-3 SLM - 张善友

张善友
张善友 · 2024-08-04T09:31:00Z

利用较小的大语言模型实现有害查询检测和安全响应,通过多任务学习机制融合两个任务到一个模型里,效果在公开的大语言模型上表现相当或超过有害查询检测和安全响应的性能。

SLM 作为守护者:先驱性地利用小型语言模型进行人工智能安全

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-30T00:00:00Z

2023年,Azure OpenAI Service引领AI 2.0时代,企业在AI模型探索与应用中持续发力。微软Reactor特别带来SLMOps系列分享,卢建晖将通过三期课程,结合SLM和Azure Machine Learning Service,帮助企业完成实际生产中的工程化应用落地。

回顾 | SLMOps 系列(一) - SLMOps 基础 - Azure AI Studio 的 SLM 应用构建

dotNET跨平台
dotNET跨平台 · 2024-04-18T00:00:31Z

本文介绍了一种新的方法,通过将大型语言模型(LLM)表示与人类认知信号进行桥接,评估LLM在模拟认知语言处理方面的有效性。实验结果表明,模型扩展与LLM-脑信号相似性呈正相关,对齐训练可以显著提高LLM-脑信号相似性。

增强基于 SLM 的思维能力的认知增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

2023年,Azure OpenAI Service引领AI 2.0时代,企业在AI模型探索与应用中发力。微软Reactor推出SLMOps系列分享,帮助企业实现SLM应用的工程化落地。活动时间为2024年4月10日19:30-20:30。

【活动预告】SLMOps 系列(一)|SLMOps 基础 - Azure AI Studio 的 SLM 应用构建

dotNET跨平台
dotNET跨平台 · 2024-03-30T00:01:03Z

该研究提出了一种混合方法,通过结合不同规模的语言模型来提高自回归解码的效率。该方法利用预先训练的冻结语言模型来编码提示标记,并使用生成的表示来引导较小的语言模型更高效地生成响应。与LLM相比,该方法在翻译和摘要任务中实现了高达4倍的速度提升,但只有1-2%的性能损失。

自动生成巨大,快速生成:快速自回归解码的 LLM-to-SLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-26T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码