Hunyuan-Large Model: Tencent's Open-Source MoE Model with 5.2 Billion Activated Parameters

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

腾讯推出的混元大模型是一个开源的混合专家模型,拥有3890亿参数,其中520亿为激活参数。该模型在多项基准测试中表现优越,超越了LLama3.1-70B,并与更大模型LLama3.1-405B相比展现出相当的性能,推动了未来模型的开发与优化。

🎯

关键要点

  • 混元大模型是腾讯推出的开源混合专家模型,拥有3890亿参数。

  • 该模型的激活参数达到520亿。

  • 混元大模型在多项基准测试中表现优越,超越了LLama3.1-70B。

  • 与更大模型LLama3.1-405B相比,混元大模型展现出相当的性能。

  • 该模型的推出推动了未来模型的开发与优化。

➡️

继续阅读