阿里巴巴发布通义千问7B模型 开源免费可商用 支持8K上下文长度
💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
阿里巴巴开源了通义千问7B参数模型,包括Qwen-7B和Qweb-7B-Chat。这两个模型在阿里达摩院和Hugging Face上线,用户可下载测试。Qwen-7B是阿里云研发的70亿参数规模的大语言模型,基于Transformer,具有大规模高质量预训练数据、优秀性能、多语言支持、8K上下文长度和插件调用等特点。
🎯
关键要点
- 阿里巴巴开源了通义千问7B参数模型,包括Qwen-7B和Qweb-7B-Chat。
- 这两个模型是完全开源、免费、可商用的。
- 模型已在阿里达摩院和Hugging Face上线,用户可下载测试。
- Qwen-7B是基于Transformer的大语言模型,参数规模为70亿。
- 模型使用超过2.2万亿token的高质量预训练数据,覆盖多种数据类型。
- Qwen-7B在多个评测数据集上表现优异,超越同规模及更大规模的模型。
- 支持多语言,具有更高效的分词器和更友好的多语言表现。
- 支持8K的上下文长度,允许用户输入更长的prompt。
- Qwen-7B-Chat针对插件调用进行了特定优化,能有效调用插件。
🏷️
标签
➡️