OneFlow深度学习框架 ·

最强开源大模型面世：阿里发布Qwen2

💡 原文中文，约1700字，阅读约需5分钟。

📝

内容提要

阿里巴巴通义千问团队发布了Qwen2系列开源模型，包括5个尺寸的预训练和指令微调模型。硅基流动团队在云服务平台SiliconCloud上线了Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B模型。Qwen2在多个评测基准上具有领先优势，能匹敌Llama-3-70B-Instruct。Qwen2-72B-Instruct具有显著的效果提升。Qwen2模型支持长达128K tokens上下文长度。SiliconCloud是一站式云服务平台，提供多种开源大语言模型和图片生成模型，以及大模型推理加速服务。

🎯

关键要点

阿里巴巴通义千问团队发布了Qwen2系列开源模型，包括5个尺寸的预训练和指令微调模型。
硅基流动团队在云服务平台SiliconCloud上线了Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B模型。
Qwen2在多个评测基准上具有领先优势，能匹敌Llama-3-70B-Instruct。
Qwen2-72B-Instruct在基础能力和对齐人类价值观方面取得了较好平衡。
Qwen2系列模型支持长达128K tokens上下文长度，适合长文本处理。
Qwen2-72B-Instruct在安全性方面与GPT-4表现相当，优于Mistral-8x22B模型。
SiliconCloud是集合主流开源大模型的一站式云服务平台，提供多种模型和推理加速服务。

❓

延伸问答

Qwen2系列模型有哪些尺寸？

Qwen2系列模型包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。

Qwen2-72B-Instruct在评测中表现如何？

Qwen2-72B-Instruct在16个基准测试中表现优异，基础能力和对齐人类价值观方面取得了较好平衡，能匹敌Llama-3-70B-Instruct。

SiliconCloud平台提供哪些服务？

SiliconCloud是一个一站式云服务平台，提供多种开源大语言模型和推理加速服务。

Qwen2模型支持的上下文长度是多少？

Qwen2系列模型支持长达128K tokens的上下文长度。

Qwen2在安全性方面的表现如何？

Qwen2-72B-Instruct在安全性方面与GPT-4表现相当，优于Mistral-8x22B模型。

Qwen2模型的多语言能力如何？

Qwen2模型针对27种语言进行了增强，优化了多语言场景中的语言转换问题。

🏷️