Blog on Qwen ·

Qwen2.5-1M: 支持100万Token上下文的开源Qwen模型

💡 原文中文，约5600字，阅读约需14分钟。

📝

内容提要

Qwen2.5-1M模型正式发布，支持1M上下文长度，包含两个新开源模型。推理框架速度提升3-7倍，长文本任务表现优于128K版本，短文本任务性能保持稳定。模型采用稀疏注意力和长度外推技术，优化推理效率，未来将继续提升性能和应用范围。

🎯

关键要点

Qwen2.5-1M模型正式发布，支持最多1M的上下文长度。
发布了两个新开源模型：Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。
推理框架速度提升3-7倍，特别是在处理1M长度输入时。
长上下文任务中，Qwen2.5-1M系列模型显著优于128K版本，尤其在64K以上任务表现出色。
短文本任务性能稳定，与128K版本相当，确保基本能力未受影响。
采用稀疏注意力和长度外推技术，优化推理效率。
未来将继续提升模型性能和应用范围。

❓

延伸问答

Qwen2.5-1M模型的上下文长度是多少？

Qwen2.5-1M模型支持最多1M的上下文长度。

Qwen2.5-1M模型与128K版本相比有什么优势？

Qwen2.5-1M模型在长上下文任务中显著优于128K版本，尤其在处理超过64K长度的任务时表现出色。

Qwen2.5-1M模型的推理速度提升了多少？

推理框架的速度提升了3到7倍，特别是在处理1M长度输入时。

Qwen2.5-1M模型采用了哪些技术来优化推理效率？

模型采用了稀疏注意力和长度外推技术来优化推理效率。

如何在本地部署Qwen2.5-1M模型？

需要准备支持优化内核的GPU，安装依赖项，并启动OpenAI兼容的API服务。

Qwen2.5-1M模型在短文本任务中的表现如何？

Qwen2.5-1M模型在短文本任务上的表现与128K版本相当，确保基本能力未受影响。

🏷️

继续阅读

特朗普签署行政命令，要求在发布前审查人工智能模型
特朗普签署行政命令，要求AI公司在发布前自愿向政府分享其模型，以促进安全创新并增强网络安全。该命令强调AI行业的成功与创新不应受到过度监管，同时承认新技术...
查询标签：您的数据仓库查询所缺失的上下文
Databricks推出了查询标签功能，允许用户为每个SQL执行添加自定义业务上下文，以便追踪和分析查询。通过自动标记，用户可以识别查询来源、成本中心和项...
在线教程丨英伟达开源LocateAnything，3B模型可实现图像+视频的目标指向/开放词汇目标检测/指代表达定位/OCR文本定位等功能
NVIDIA 最近推出了视觉语言定位模型LocateAnything-3B，拥有30亿参数，支持多种视觉定位任务。其核心创新为并行框解码（PBD），显著提...
金融机构为何趋向于交易基础模型以构建自身智能
金融机构正在采用交易基础模型，构建统一的智能系统，以克服现有模型的孤立性。通过大型AI系统，机构能够更好地理解消费者行为，提升反欺诈和信用评分等领域的表现...
GPT Realtime 2.0实时语音模型17个创业方向
GPT Realtime 2.0模型实现了边听边思考的实时智能应用，提供了17个创业机会，如实时合同谈判助手、语音控制交易终端和多语种活动主持人。这些应用...
内网升级vLLM及模型教程
本文介绍了如何在内网升级vLLM及AI模型。建议定期更新vLLM以获取新特性，通过简单命令安装新版vLLM，并使用huggingface-cli下载新模型...