在TensorRT 10之前,隐式量化无法自定义缩放因子。本文介绍了一种技巧,允许用户通过量化和反量化权重张量来实现自定义缩放因子,从而确保量化效果接近预期。
完成下面两步后,将自动完成登录并继续当前操作。