介绍 on SuperTechFans ·

2026 03 09 HackerNews

💡 原文中文，约30600字，阅读约需73分钟。

📝

内容提要

本文介绍了阿里云Qwen 3.5系列大模型的本地运行指南，涵盖多种模型及其推理与部署方法。Qwen 3.5支持256K上下文长度，适用于多种任务，强调使用优化的GGUF格式模型，并提供详细的内存需求和推理设置，建议用户根据硬件配置选择合适的模型。

🎯

关键要点

阿里云Qwen 3.5系列大模型本地运行指南介绍了多种模型及其推理与部署方法。
Qwen 3.5支持256K上下文长度，适用于多种任务，包括代码生成和长文本处理。
强调使用优化的GGUF格式模型，提供动态量化技术以提升性能。
提供详细的内存需求表，建议用户根据硬件配置选择合适的模型。
推荐的推理设置包括最大上下文窗口262,144和输出长度32,768 tokens。
用户可通过命令行参数控制思考功能的启用与禁用。
指南提供了基于llama.cpp的本地部署教程，支持CPU和GPU推理。
Qwen 3.5在编码任务中表现良好，但在非编码任务中体验不佳，建议设定特定角色以改善输出风格。
小型模型通过高质量微调可达到与大模型相当的性能。
Qwen 3.5在长上下文处理上存在退化问题，需注意上下文增长对指令遵循能力的影响。

🏷️

继续阅读

续航 1704 公里！18.68 万元的小鹏 G6，成为了全球最长续航 SUV
小鹏在广州发布G6超级增程版，起售价18.68万元，配备60升油箱和55.8度电池，综合续航1704公里。支持800V快充，12分钟充电可达80%。搭载自...
硬核测评：哪门语言最受 AI 宠爱？13 种语言横向对比，Go 表现如何？
随着AI编程工具的普及，编程语言的选择变得至关重要。Yusuke Endoh的报告评测了13种语言，结果显示动态语言如Ruby和Python表现优异，而G...
早报｜折叠屏iPhone或命名为iPhone Ultra/雷军：未来每天上班两小时就够了/龙虾之父辟谣官方微博账号：从没用过微博
苹果即将推出的折叠屏 iPhone 可能命名为「iPhone Ultra」，售价约 2000 美元。同时，公司更新了三位高管，涉及设计和法务部门。此外，苹...
派早报：苹果禁止美国用户下载中国版字节跳动应用
苹果因美国国会通过相关法案，禁止美国用户下载字节跳动的中国版应用，并利用物理位置检测技术阻止其访问。此限制仅针对字节跳动，Android用户影响较小。
Radim Marek：无生产数据的生产查询计划
之前的讨论表明，注入relpages并不有效，因为规划器会根据实际文件大小进行检查并按比例缩放，这限制了其对绝对行数的估计。要获得与生产环境相符的数字，仍...
dnode-py Client
本文介绍了NFD客户端节点的Python实现，支持Android APK和跨平台功能，涵盖服务端地址优先级、配置文件路径、日志设置和隧道管理等内容，并提供...

2026 03 09 HackerNews

内容提要

关键要点

标签

继续阅读