dotNET跨平台 ·

在24GB M4 MacBook上跑本地大模型：Qwen 3.5-9B实测40 tokens/s，支持工具调用

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

开发者jola分享了在M4 MacBook Pro上运行Qwen 3.5-9B（Q4_K_S量化版）本地大语言模型的经验，尽管该模型无法完成复杂任务，但它提升了开发者的参与度，成为一种可控的离线助手，适合24GB内存的用户。

🎯

❓

在M4 MacBook Pro上，Qwen 3.5-9B的生成速度约为40 tokens/秒。

因为Qwen 3.5-9B在压缩后仍保留足够的推理能力，适合24GB内存的用户。

Qwen 3.5-9B支持128K的上下文窗口，适合代码分析和文档阅读场景。

推荐的参数配置包括temperature=0.6、top_p=0.95、top_k=20等，并需启用thinking模式。

本地模型无法独立完成复杂任务，但迫使开发者保持更高的参与度。

提供了一个可行的离线AI助手选项，不需要订阅费，也不依赖网络。

🏷️

Google’s Aluminium OS revealed in 16-minute leaked video
Aluminium OS, Google's upcoming version of Android for PC, may have just ...
AI团队花费数月时间开发的网络爬虫，SerpApi通过一次API调用即可替代
SerpApi 是一个网络搜索 API，简化了从搜索引擎获取数据的过程，避免了 IP 阻塞和 CAPTCHA 等问题。开发者可以通过调用 API 获取结构...
AI Coding 工具的实践经验
本文总结了AI编码工具的实践经验，强调基本原理和权限控制。AI通过API调用生成文本，权限管理由Agent实现，以确保不同角色的操作限制。工具和MCP提供...
TeamCity 2026.1：命令行工具（CLI）、AI代理的模型上下文协议（MCP）支持、管道增强及更多功能
TeamCity 2026.1发布了新功能，包括命令行工具（CLI）、AI代理的模型上下文协议（MCP）支持和管道增强。此版本修复了高危安全漏洞（CVE-...
Qodana 2026.1：Rust早期访问，稳定的C/C++支持和新的代码检查
Qodana 2026.1版本发布，正式支持C/C++，Rust进入早期访问阶段。新增150多个代码检查，涵盖Kotlin、Python和C#，帮助开发者...
Qt文档MCP工具介绍
Qt文档MCP工具通过提供结构化API参考，减少了AI代理在搜索文档时的令牌消耗。与社区资源不同，MCP工具的答案来自Qt官方文档，确保信息准确。该工具具...