图睿科技在2025年全球闪存峰会上荣获“2025年度闪存存储GPU加速全能金奖”。其SupremeRAID系列GPU RAID卡专为NVMe设计,性能提升4到10倍,支持多种RAID模式,确保数据完整性与安全性。
本研究通过将模型参数存储在闪存中,提出“窗口化”和“行列捆绑”技术,减少数据传输,提高数据块大小,使大型语言模型在超出DRAM容量时高效运行。CPU和GPU推理速度分别提升4-5倍和20-25倍。结合稀疏感知和上下文自适应加载,为内存有限设备上的LLMs推理提供新方法。
完成下面两步后,将自动完成登录并继续当前操作。