The New Stack ·

为什么红帽认为人工智能的未来是小型语言模型

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

大型语言模型（LLM）不适合所有企业需求，企业更需要可定制的小型模型。小型模型成本效益高，能够访问私有数据，并可作为工作流的“构建块”。InstructLab项目通过合成数据生成和简单命令，帮助企业训练小型模型，并支持开源以避免知识产权问题。

🎯

关键要点

大型语言模型（LLM）不适合所有企业需求，企业更需要可定制的小型模型。
小型模型成本效益高，能够访问私有数据，并可作为工作流的“构建块”。
开发者应利用小型模型，因为它们可以在工作流中作为“构建块”。
小型语言模型相对较小，但仍基于变换器模型架构。
生成小型模型的选项包括检索增强生成（RAG），但RAG也有其局限性。
InstructLab项目通过合成数据生成和简单命令，帮助企业训练小型模型。
开源选择如InstructLab可以避免知识产权问题，并提供许可优势。
Red Hat最近增加了推理服务器，以支持运行大型语言模型。

❓

延伸问答

为什么红帽认为小型语言模型更适合企业需求？

红帽认为小型语言模型更适合企业需求，因为它们可定制、成本效益高，并能访问私有数据，适合特定的用例。

InstructLab项目是如何帮助企业训练小型模型的？

InstructLab项目通过合成数据生成和简单命令，帮助企业进行监督微调，从而训练小型模型。

小型语言模型的生成选项有哪些？

小型语言模型的生成选项包括检索增强生成（RAG）和合成数据生成等方法。

使用小型模型的主要原因是什么？

使用小型模型的主要原因包括成本效益、访问私有数据以及作为工作流中的“构建块”。

为什么开源在人工智能中很重要？

开源在人工智能中重要，因为它可以避免知识产权问题，并提供许可优势，方便企业使用和分发模型。

小型语言模型的参数规模通常是多少？

小型语言模型的参数规模通常在3亿到70亿之间，相对较小，但仍基于变换器模型架构。

🏷️

继续阅读

这是你的笔记本电脑……在人工智能时代
在开发者大会上，大型科技公司强调人工智能将改变工作方式。Nvidia的黄仁勋介绍了新型笔记本电脑的使用方式。尽管AI产品不断涌现，人们仍在思考这些变化的必...
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...
首尔的目标：NVIDIA与韩国如何共同构建AI的未来
NVIDIA创始人兼首席执行官黄仁勋访问韩国，强调AI供应链的重要性，并指出韩国在机器人和物理AI领域的潜力。他认为韩国是AI和游戏的中心，未来将有更多投资机会。
每家公司的首个人工智能战略都应该是技能库
企业在实施人工智能时，首要任务是建立“技能图书馆”，记录优秀员工的工作流程和经验，将其转化为可重复使用的技能，以提升AI的实用性和效率，帮助公司更好地利用人工智能。
流媒体的未来：要么拿出保证，要么我不买账
流媒体正在改变视频广告购买方式，通过数据分析和AI技术优化广告投放，确保品牌投资的有效性。出版商需证明内容价值以获得更高定价，市场需要机制区分有效库存，A...
英国通信管理局（Ofcom）制定人工智能战略，相关研究正在进行中
英国通信管理局（Ofcom）发布了更新的人工智能战略，旨在支持通信行业采用人工智能并应对消费者风险。该战略强调技术中立和结果导向，推动创新并确保安全，包括...