最强开源大模型面世:阿里发布Qwen2
💡
原文中文,约1700字,阅读约需5分钟。
📝
内容提要
阿里巴巴通义千问团队发布了Qwen2系列开源模型,包括5个尺寸的预训练和指令微调模型。硅基流动团队在云服务平台SiliconCloud上线了Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B模型。Qwen2在多个评测基准上具有领先优势,能匹敌Llama-3-70B-Instruct。Qwen2-72B-Instruct具有显著的效果提升。Qwen2模型支持长达128K tokens上下文长度。SiliconCloud是一站式云服务平台,提供多种开源大语言模型和图片生成模型,以及大模型推理加速服务。
🎯
关键要点
- 阿里巴巴通义千问团队发布了Qwen2系列开源模型,包括5个尺寸的预训练和指令微调模型。
- 硅基流动团队在云服务平台SiliconCloud上线了Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B模型。
- Qwen2在多个评测基准上具有领先优势,能匹敌Llama-3-70B-Instruct。
- Qwen2-72B-Instruct在基础能力和对齐人类价值观方面取得了较好平衡。
- Qwen2系列模型支持长达128K tokens上下文长度,适合长文本处理。
- Qwen2-72B-Instruct在安全性方面与GPT-4表现相当,优于Mistral-8x22B模型。
- SiliconCloud是集合主流开源大模型的一站式云服务平台,提供多种模型和推理加速服务。
➡️