移远通信与RWKV公司合作,优化RWKV大模型在端侧设备的部署。RWKV结合了RNN和Transformer的优点,具有低推理和训练成本。双方在2025世界人工智能大会展示了RWKV Chat和数独解决方案,移远的SG885G平台支持多模态模型的本地推理,兼容多种开源模型。
上海交通大学与本智激活联合推出的SmallThinker大模型,专为低算力端侧设备设计,能够在普通手机上高效运行,提升AI隐私保护和使用便捷性。
清华大学与面壁智能团队推出的MiniCPM 4模型,提供0.5B和8B参数规模,训练开销仅为22%。该模型在长文本处理上实现5倍加速,采用稀疏注意力架构,性能超越多款同类模型,适合端侧设备,具备高效推理能力。
完成下面两步后,将自动完成登录并继续当前操作。