本研究提出了一种后训练量化框架,成功在3D医疗分割模型上实现8位量化,显著降低模型大小和推理延迟,同时保持性能,为资源受限的医疗成像应用提供高效解决方案。
完成下面两步后,将自动完成登录并继续当前操作。