小红花·文摘

Qwen团队发布了两个新模型：Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507，分别增强了通用能力和推理能力。其中，Qwen3-4B-Thinking-2507在AIME25测评中得分81.3，超越多家竞争对手，适合小型设备运行。

量子位 ·

本文介绍了MobileLLM模型的设计及其在小型设备上的性能提升。通过共享和分组查询注意机制，MobileLLM显著提高了准确度，展示了在智能手机上进行大型语言模型推理的可行性。同时，研究探讨了多模态大语言模型的进展及应用潜力。

BriefGPT - AI 论文速递 ·