Databricks ·

宣布DBRX：高效开源大型语言模型的新标准

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

Databricks开源了DBRX，一个大型语言模型，在各种基准测试中表现优于已建立的开源模型。DBRX在大多数基准测试中也超过了GPT-3.5。它是一个基于MegaBlocks研究和开源项目的Mixture-of-Experts模型，使其在每秒标记方面非常快速。Databricks相信开源语言模型将继续蓬勃发展，并为组织提供了定制模型以满足其特定需求的机会。DBRX被设计为易于定制，并可通过Databricks平台访问。

🎯

关键要点

Databricks开源了DBRX，一个大型语言模型，超越了所有已建立的开源模型。
DBRX在语言理解、编程、数学和逻辑等方面优于LLaMA2-70B、Mixtral和Grok-1等开源模型。
DBRX在大多数基准测试中超过了GPT-3.5，反映出企业对开源模型的需求增加。
DBRX是基于MegaBlocks研究的Mixture-of-Experts模型，具有极快的处理速度。
DBRX的设计使其易于定制，企业可以根据自己的私有数据构建定制模型。
DBRX的训练数据通过Unity Catalog集中管理，使用Apache Spark™进行处理和清洗。
Databricks提供了一个端到端的平台，支持高质量AI应用的构建，DBRX是这一能力的体现。
企业客户如JetBlue、Block、NASDAQ和Accenture已经在使用这些工具构建高质量的AI系统。

❓

延伸问答

DBRX与其他开源模型相比有什么优势？

DBRX在语言理解、编程、数学和逻辑等方面超越了LLaMA2-70B、Mixtral和Grok-1等开源模型。

DBRX是如何提高处理速度的？

DBRX是基于Mixture-of-Experts模型，使用36亿个参数以实现极快的处理速度，同时模型本身有1320亿个参数。

企业如何利用DBRX进行定制？

企业可以通过Databricks平台与DBRX互动，利用其长上下文能力构建基于私有数据的定制模型。

DBRX在基准测试中表现如何？

DBRX在大多数基准测试中超过了GPT-3.5，显示出开源模型的质量持续提升。

DBRX的训练数据是如何管理的？

DBRX的训练数据通过Unity Catalog集中管理，并使用Apache Spark™进行处理和清洗。

哪些企业已经在使用DBRX？

JetBlue、Block、NASDAQ和Accenture等企业已经在使用DBRX构建高质量的AI系统。

🏷️