阿里云推出开源Qwen2.5-1M模型,支持100万Tokens上下文,处理长文本任务超越GPT-4o-mini。该模型有7B和14B两种版本,推理速度提升近7倍,适合长篇小说和学术论文解析。开发者可在多个平台下载体验。
Qwen2.5-1M模型正式发布,支持1M上下文长度,包含两个新开源模型。推理框架速度提升3-7倍,长文本任务表现优于128K版本,短文本任务性能保持稳定。模型采用稀疏注意力和长度外推技术,优化推理效率,未来将继续提升性能和应用范围。
完成下面两步后,将自动完成登录并继续当前操作。