SwapNet是一种用于边缘人工智能设备的高效DNN块交换中间件,能够在较小的内存预算内执行大规模DNN。它通过消除不必要的内存操作,几乎与具有充足内存的情况下的延迟相同。SwapNet的设计为将大型语言模型部署到边缘人工智能设备上提供了新的见解。
完成下面两步后,将自动完成登录并继续当前操作。