MobileLLM通过深瘦架构和嵌入共享机制,在125M和350M模型上分别提升了2.7%和4.3%的准确度。即时分块权重共享方法不增加模型大小,仅带来微小延迟。MobileLLM-LS进一步提升了0.7%和0.8%的准确度。该模型在聊天基准测试中表现优异,接近LLaMA-v2 7B,展示了小型模型在常见设备上的能力。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: