阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

💡 原文中文,约800字,阅读约需2分钟。
📝

内容提要

ModelScope和Hugging Face发布了Qwen-72B和Qwen-1.8B等新的语言模型,它们在3T令牌上进行训练,并支持32k上下文。Qwen在中文测试中击败了GPT-4,但在英语中仍落后于GPT4。Starling-LM-7B是一种开创性的大型语言模型,利用了GPT-4标记排名数据集和先进的训练方法,相对于GPT-4在MT Bench中获得了8.09分,为AI语言理解树立了高标准。

🎯

关键要点

  • ModelScope和Hugging Face发布了Qwen-72B和Qwen-1.8B等新的语言模型,支持32k上下文,训练在3T令牌上。
  • Qwen在中文测试中击败了GPT-4,但在英语中仍落后于GPT-4。
  • Qwen-72B的最大性能与GPT-3.5相当,所有基准测试均为普通话。
  • Starling-LM-7B是由加州大学伯克利分校开发的开创性大型语言模型,利用了GPT-4标记排名数据集和先进的训练方法。
  • Starling-LM-7B在MT Bench中获得8.09分,超越了除GPT-4和GPT-4 Turbo之外的其他模型,为AI语言理解树立了高标准。
➡️

继续阅读