阿里云开源通义千问Qweb2 支持128K上下文 在测试中表现不俗
原文中文,约1300字,阅读约需4分钟。发表于: 。#人工智能 阿里云推出通义千问 Qwen2 系列模型,完全开源,提供 0.5B~72B 之间 5 个版本,在各项评测中表现不俗。有兴趣的开发者现在就可以通过 GitHub 等平台获取最新模型。查看全文:https://ourl.co/104358
阿里云推出通义千问Qwen2系列模型,提供5个版本,表现不俗。模型能力较前版本提升,支持128K tokens,增加27种语言训练。Qwen2超过Llama3和Mixtral-8x22B,给Meta带来压力。模型经过微调,提升智能水平,对人类有帮助、诚实和安全。使用多种自动方法获取高质量指令和偏好数据,训练方面采用多种方法。