阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

原文约800字,阅读约需2分钟。发表于:

2023.11.30 我们在 ModelScope 和 Hugging Face 上发布了Qwen-72B和Qwen-72B-Chat,它们在 3T 令牌上进行训练并支持 32k 上下文 ,以及Qwen-1.8B和Qwen-1.8B-Chat 。 我们还增强了 Qwen-72B-Chat 和 Qwen-1.8B-Chat 的系统提示功能,请参阅

ModelScope和Hugging Face发布了Qwen-72B和Qwen-1.8B等新的语言模型,它们在3T令牌上进行训练,并支持32k上下文。Qwen在中文测试中击败了GPT-4,但在英语中仍落后于GPT4。Starling-LM-7B是一种开创性的大型语言模型,利用了GPT-4标记排名数据集和先进的训练方法,相对于GPT-4在MT Bench中获得了8.09分,为AI语言理解树立了高标准。

相关推荐 去reddit讨论