小红花·文摘

阿里云Qwen推出首个开源长文本模型，支持1M Tokens，性能超越GPT-4o-mini。新模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，处理长文本速度提升近7倍，适用于复杂任务。模型采用长上下文训练、长度外推和稀疏注意力机制，推理速度显著提高。