Qwen团队发布了两个新模型:Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,分别增强了通用能力和推理能力。其中,Qwen3-4B-Thinking-2507在AIME25测评中得分81.3,超越多家竞争对手,适合小型设备运行。
本文介绍了MobileLLM模型的设计及其在小型设备上的性能提升。通过共享和分组查询注意机制,MobileLLM显著提高了准确度,展示了在智能手机上进行大型语言模型推理的可行性。同时,研究探讨了多模态大语言模型的进展及应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。