小红花·文摘

本研究提出了一种汉明注意力蒸馏方法，通过对键和值进行二值化，利用汉明距离替代点积计算，从而显著提高长上下文变换器的效率。该方法在多个任务中展现出优越的准确性，并降低了计算成本。