蓝点网 ·

阿里巴巴发布Qwen3.5中型系列模型量化版可在24GB内存/显存的上本地运行

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

阿里巴巴通义千问团队发布了Qwen3.5中型系列模型，强调以更小的参数实现更高的智能。新模型在基准测试中超越了旧版，支持在24GB内存设备上运行，适合个人和企业使用。

🎯

关键要点

阿里巴巴通义千问团队发布了Qwen3.5中型系列模型，强调以更小的参数实现更高的智能。
新模型在基准测试中超越了旧版，显示出更好的架构、数据质量和强化学习推动智能进步。
Qwen3.5-35B-A3B模型采用MoE混合专家架构，总参数为35B，激活参数为3B，适合复杂推理和多语言理解。
Qwen3.5-122B-A10B模型总参数为122B，重点优化复杂智能体任务和长上下文处理能力。
Qwen3.5-27B模型为纯稠密模型，适合本地部署，降低推理成本。
Qwen3.5-Flash版本支持企业级API调用，适合实时应用场景。
所有新发布的模型均为开源，个人和企业可下载微调或直接使用。
GGUF量化版可在仅有24GB内存的设备上运行，降低模型运行成本。

❓

延伸问答

Qwen3.5中型系列模型的主要特点是什么？

Qwen3.5中型系列模型强调以更小的参数实现更高的智能，优化了模型架构、数据质量和强化学习。

Qwen3.5-35B-A3B模型适合什么类型的任务？

Qwen3.5-35B-A3B模型适合复杂推理、多语言理解和多模态任务，尤其在智能体场景中表现出色。

如何在24GB内存的设备上运行Qwen3.5模型？

GGUF量化版的Qwen3.5模型可以在仅有24GB内存的设备上本地运行，显著降低运行成本。

Qwen3.5-122B-A10B模型的主要优势是什么？

Qwen3.5-122B-A10B模型优化了复杂智能体任务和长上下文处理能力，缩小了中型模型与大型模型之间的差距。

Qwen3.5系列模型是否开源？

是的，所有新发布的Qwen3.5系列模型均为开源，个人和企业可以下载微调或直接使用。

Qwen3.5-Flash版本适合什么应用场景？

Qwen3.5-Flash版本适合企业级API调用和实时应用场景，支持1M上下文长度和官方工具调用能力。

🏷️

继续阅读

[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...
Winxvideo AI 二十周年限免：视频压缩、本地AI提升画质、防抖
Winxvideo AI 正在进行二十周年限免活动，用户只需提供邮箱即可获取注册码。该软件集视频增强、图片修复、格式转换等功能于一体，支持超分辨率提升、帧...
从超级个体到超级团队，腾讯云发布WorkBuddy企业版
腾讯云在AI产业应用大会上发布了WorkBuddy企业版及办公智能体套件，旨在帮助企业实现AI转型。该套件提供数字员工、人机协作和团队管理功能，提升工作效...

阿里巴巴发布Qwen3.5中型系列模型 量化版可在24GB内存/显存的上本地运行