本研究提出了一种汉明注意力蒸馏方法,通过对键和值进行二值化,利用汉明距离替代点积计算,从而显著提高长上下文变换器的效率。该方法在多个任务中展现出优越的准确性,并降低了计算成本。
完成下面两步后,将自动完成登录并继续当前操作。