小红花·文摘

文章讨论了Qwen3模型的架构与预训练过程，强调其在多语言和长上下文处理上的优势。Qwen3通过三个阶段的预训练提升语言能力，结合思维模式融合和强化学习，优化了推理能力和响应质量。

一文通透Qwen LLM系列——从Qwen、Qwen1.5、Qwen2、Qwen2.5到Qwen3(融合了chat和推理)、Qwen3 MoE

结构之法算法之道 ·

Qwen1.5-110B：Qwen1.5系列的首个千亿参数开源模型

Blog on Qwen ·

GITHUB HUGGING FACE MODELSCOPE DEMO WeChat 简介...

Qwen1.5-32B：Qwen1.5语言模型系列的最后一块拼图

Blog on Qwen ·

GITHUB HUGGING FACE MODELSCOPE DEMO DISCORD 介绍今天，我们推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。它仅拥有27亿个激活参数，但其性能却能与当前最先进的70亿参数模型，如Mistral...

Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能

Blog on Qwen ·

阿里云推出开源语言模型系列Qwen1.5，提供多语言能力、人类偏好对齐和长序列支持。阿里云的人工智能平台PAI提供技术支持，可实现模型的微调和快速部署。Qwen1.5模型在性能评测中表现出优异的竞争力。用户可以通过PAI控制台或Python SDK使用模型。

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

阿里云云栖号 ·

本文介绍了使用低成本显卡和llama.cpp推理Qwen1.5-14B-Chat模型的方法，包括使用Tesla P4显卡和GPU + CPU混合计算，在2048上下文支持下达到11个token/s的速度。文章还讨论了模型大小、量化方法的困惑度矩阵和不同模型的性能表现。作者提供了llama.cpp的部署和调用方法，并讨论了提高推理速度的改进点。最后，作者总结了Tesla P4显卡的优缺点，并强调了llama.cpp项目的重要性。

使用 300 元的显卡推理 Qwen1.5-14B

Lucien's Blog ·

GITHUB HUGGING FACE MODELSCOPE DEMO WeChat 简介最近几个月，我们专注探索如何构建一个真正「卓越」的模型，并在此过程中不断提升开发者的使用体验。农历新年到来之际，我们推出通义千问开源模型1.5版本: Qwen1.5。我们开源了包括0.5B、1.8B、4B、7B、14B、32B、72B和110B共计8个不同规模的Base和Chat模型，,...

Qwen1.5 介绍

Blog on Qwen ·